NO.1 项目简介
近年来,知识图谱在人工智能应用中扮演着越来越重要的角色,成为推荐系统、对话系统和问答系统等多个人工智能应用的重要组成部分。知识图谱由知识三元组组成,如(Beijing, capitalOf,China)表示北京是中国的首都。最近一段时间,许多人工构建的知识图谱被相继提出,然而它们仍远不完善和全面。
为了源源不断地丰富现有知识图谱,人们开始采用自动化的知识推理方式进行三元组的获取。例如当有(Donald Trump,BornIn,New York)和(New York,locateIn,USA)时,机器应以较高的概率推理出(Donald Trump,nationality,USA)这样一个新的三元组。本课题将对这一推理过程进行建模,使学生学习获得相关的自然语言处理与大数据挖掘知识。
本课题的核心内容:
一、讲授python基础知识,包括python的数组、循环、切片等基础模块以及numpy、pandas等常见第三方扩展包,为本课程的编码实现打好基础。
二、学习经典的自动化机器推理模型,了解其优缺点。
三、选择自己感兴趣的模型,进一步了解其细节及原理,尝试代码实现自动推理的模型,并在学术数据集上进行实验验证。
四、讲授基本的科技论文写作技巧。
NO.2 适合人群
适合对人工智能、自然语言处理、大数据挖掘等方向感兴趣的高中生、本科生。
NO.3 导师介绍
中国科学院 助理研究员
博士毕业于中国科学院计算技术研究所,曾赴伦敦大学学院人工智能中心任访问学者,并在百度研究院和阿里巴巴跨境电商技术部担任技术顾问。在顶级学术会议和期刊发表文章多篇。
任职学校 中国科学院计算技术研究所
中国科学院计算技术研究所(简称计算所)创建于1956年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。计算所研制成功了我国第一台通用数字电子计算机,并形成了我国高性能计算机的研发基地,我国首枚通用CPU芯片也诞生在这里。
计算所是我国计算机事业的摇篮。伴随着计算所的发生发展,先后为国家培养了几百名我国最早的计算技术专业人员,在这里工作或学习过的院士有二十余位。随着学科与技术发展,从计算所陆续分离出中科院微电子学研究所、计算中心、软件所和网络中心等多个研究机构,以及联想、曙光等高技术企业。六十多年来,计算所在科学研究和科技成果等方面取得了显著成就。截至2020年底,计算所获得国家、院、市、部级科技奖励237项,其中,国家级科技奖励52项(含非第一完成单位14项),院、市、部级科技奖励185项(含非第一完成单位21项)。
计算所坚持“基础性、战略性、前瞻性”的三性原则,坚持新时期办院方针,以“跻身国际前沿,关注国计民生,引领中国信息产业”为己任,落实“创新、求实”的理念,力争成为世界一流的科研学术机构。
NO.4 项目大纲
01理论知识课
讲授知识图谱和知识推理的背景知识,包括知识图谱的定义,知识图谱的应用案例;讲解python基础知识。
02理论知识课
完成对python基础知识的讲解,包括python的数组、循环、切片等基础模块以及numpy、pandas等常见第三方扩展包,为本课程的编码实现打好基础。
03理论知识课
对知识推理模型进行概要性介绍,尝试将现有模型分为基于几何关系类模型以及基于语义匹配类模型;对基于几何关系类模型的发展脉络进行介绍。
04 理论知识课
对语义匹配类知识推理模型进行介绍;引导学生进行选题。
05 实战应用课
听取学生的开题汇报,并给出指导建议,确定最终选题;讨论现有知识推理模型的不足,以及可能的改进方向;讲授学术界针对现有模型缺陷的最新研究进展。
06 实战应用课
在第5讲的基础上,继续讨论现有知识推理模型的不足,以及可能的改进方向;讲授学术界针对现有模型缺陷的最新研究进展。
07 论文指导课
讲授科研报告写作的基本原则和规律,科研报告各部分的写法及规范。
08 结题汇报课
以小组/个人为单位进行展示汇报
NO.5 课题安排
上课形式:Zoom直播
上课时间:每周六晚上7点至9点
班级规模:5人开班,满班8人;小组形式
课程安排:18课时科研先导课+8周20课时教授科研+不限次论文辅导课
NO.6项目成果教授推荐信,支持网推
EI/CPCI/Scopus索引国际会议论文发表与收录
完整的科研经历,丰富升学文书素材
汉世天下留学
集结全球优秀教师,开创双导师服务体系,坚持长期陪伴式规划,规划导师均来自不同国家毕业世界著名学校;汉世天下以奋斗者为本,创造客户价值,坚持长期主义,以培养中国青少年梦想、远见、勇气、笃行作为愿景,助力实现留学梦想。