人工智能技术在文献资料整合中的应用

申报人:杨通烜 申报日期:2024-06-25

基本情况

2024
人工智能技术在文献资料整合中的应用 盲选
创新训练项目
文学
中国语言文学类
学生自主选题
一年期
本项目探索人工智能技术在文献资料整合中的应用,利用AI大模型收集、分类和整合文献资料。通过扫描识别、信息提取和整合流程,为中文系学生提供高效的论文写作辅助。项目旨在了解不同AI大模型的优劣,掌握其使用方法,以期在提升论文写作效率与质量方面发挥显著作用。
主持校级课题2项:《文化人类学视域下的“皇帝”与巫术研究》(XYB202317);唐诗与太阳神话研究(RRCQC202307)
选题以及课题设计思路上的建议与指导
省级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
杨通烜 人文社会科学学院 汉语言文学 2022 项目整体统筹
刘书含 人文社会科学学院 汉语言文学 2023 宣传策划
谭琳 人文社会科学学院 汉语言文学 2023 其他工作
刘沃野 人文社会科学学院 汉语言文学 2023 财务管理
刘晓鸣 人文社会科学学院 汉语言文学 2023 项目外联

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
高磊 人文社会科学学院

立项依据

本项目旨在利用人工智能技术,特别是AI大语言模型,查找、归纳、总结论文写作所需的文献资料。提高文献资料整合的效率和质量,探索人工智能辅助中文系学生论文写作的方法与流程。
1.熟悉人工智能的发展趋势和背景,探讨如GPT等模型的应用场景与优势。
2.比较探索各种不同AI工具在文献资料整合中的特点和适用性。
3.使用AI工具收集和提取文献资料,对扫描后的文档进行识别和修复,以及对提炼后的文献资料进行分类和整合。

人工智能,英文Artificial Intelligence,缩写为“AI”。作为新一轮科技革命和产业变革的重要驱动力量,人工智能在当今时代扮演着极为重要的角色,在工业、金融、医疗、教育等诸多领域发挥着关键作用。在工业领域,人工智能赋予机器科技的力量,将其智能化、便利化、精细化,半自动化生产转为全自动化生产。人工智能的大数据分析用于辅助投资决策,预防金融风险,快捷支付等方面,维护着金融领域发展的健康与安全。从医学影像的分析与辅助诊疗到电子病历与导诊机器人,甚至在疾病的预测与预防、保健的管理与监督等医疗领域诸多方面,人工智能都起到重要作用。
同时,人工智能在教育领域也有着极为广泛的应用,如智能课堂、智能辅导、智能测评、个性化学习等,都改变着传统教学的思维与方式。如赵顺,胡丽斌《AI技术助力学生错题本的建立与应用实践研究》(《中国现代教育装备》,2019年第16期)探讨了人工智能在学生整理错题,建立并高效使用错题本的优势,并展开了试点应用。高佳燕《ChatGPT辅助高职教师备课的研究与实践》(《陕西青年职业学院学报》,2023年第3期)对人工智能工具ChatGPT在高效教师备课所起到的作用进行了实践研究,包括课程内容的选择、设计,资料搜集、分析等方面。
此外,人工智能在图书、档案的收集、整理过程中,具有高效率、准确性的突出优势。傅平,邹小筑,吴丹,叶志锋《回顾与展望:人工智能在图书馆的应用》(《图书情报知识》2018年第2期)利用文献回顾和例举分析的方法系统研究了人工智能在图书馆自动化的应用现状和发展趋势。杨九龙,阳玉堃,许碧涵《人工智能在图书馆应用的理论逻辑、现实困境与路径展望》(《图书情报工作》,2019年第4期)、李宇,鲁超,马波《创新驱动背景下人工智能在图书馆的应用研究与展望》(《图书馆理论与实践》,2022年第3期)等论文也对人工智能在图书馆的应用方面进行了研究与展望。郑杨,石进,司徒凌云,李明《智能目录构建与发展研究》(《图书馆学研究》,2021年第17期)在了解当代目录学研究现状的基础上,提出了利用人工智能实现智能目录的新思路。侯向辉《AI2.0时代地市级图书馆古籍网格化管理研究》(《计算机应用文摘》2023年第13期)探讨了地市级图书馆应用AI大数据进行古籍网格化管理的优势。人工智能在档案管理方面的研究,如陈雅茜,李亚琼《后疫情时代高校档案收集整理的AI化探析》(《武汉理工大学学报(信息与管理工程版)》,2022年第3期)针对在后疫情时代发生的诸多问题,认为高校利用人工智能能够高效地进行收集整理档案。岳幸晖,杨智勇《人工智能在档案管理中的应用图景与风险防范》(《档案与建设》,2023年第10期)分析了人工智能在档案管理中的可能面临的风险,并提出了相应的对策。
古籍文献资料的智能化分析整理是论文文献资料整合的重点之一,但目前的研究并充分。张军堂《古代文献资料的人工智能管理策略研究》(《今古文创》,2021年第37期)分析了人工智能对古代文献资料的管理方法,强调在多方面进行古代文献的智能管理建设。也有从古籍整理出版的角度的论述,如段涵《人工智能技术群落与古籍文献整理出版思考》(《出版广角》,2023年第12期)分析了古籍文献整理出版领域面临的一系列难题以及人工智能在这一领域的挑战,探讨了古籍文献整理出版智能化的三大未来应用场景。王忠田《人工智能大模型时代的古籍整理出版审思》(《出版广角》,2024年第4期)探讨了古籍智慧化的重要性,并对人工智能在古籍整理出版方面存在的现实难题提出了解决策略。
耿子涵《在互联网人工智能时代下语言资料查找、学习的优化》(《经济与社会发展研究》,2022年第13期)认为利用人工智能查找、优化英语语言资料,推动人工智能在语言资料查找方面的应用。耿文的研究对象是利用人工智能与英语语言资料,与本项目研究对象并不相同,但其研究理念与项目有一定的相似之处。我们认为,论文文献资料在知识大爆炸的时代,其数量呈大幅式增长的态势。利用人工智能技术将其进行有效地整合,推动人工智能应用与论文写作两个方面的进一步发展。

1.针对中文文献的适应性:
整合提炼出一套适用于中文文献的AI工具,并且在技术和资金等条件允许的情况下优化相关大模型的算法,提高文献资料整合的准确性和效率。
2.教育性和实用性结合:
结合AI大模型的优势,创造出辅助学生论文写作的流程,使学生能够熟悉和应用这些技术,从而提高其论文写作的水平和效率。

1.技术路线:
寻找和整合文献资料收集与整合的AI工具,优化相关大模型的算法,设计文献资料扫描、识别、修复、分类和整合的流程。
2.拟解决的问题:
其一,解决中文文献在AI处理中存在的特殊挑战,如语言文字的复杂性、信息提取的准确性、文献资料的整合速度等方面。
其二,降低finetuning(微调)的技术门槛和国内外一些大模型使用的信息门槛。
3.预期成果:
其一,创造出一套完整的AI辅助工具流程,可用于中文系学生的论文写作过程。
其二,帮助学生自行根据需要微调大语言模型,更好地使AI辅助工具适配和赋能学习与研究。
其三,提供详尽的市场调研和应用案例,展示该技术在提升论文写作效率方面的潜力和优势。

1.阶段一:前期调研与需求分析(第1-2个月):
分析目前AI在文献资料整合中的应用现状,调研中文系学生在论文写作中的实际需求和痛点。
2.阶段二:工具探索与验证(第3-6个月):
比较探索整理文献资料的AI工具原型,并进行初步的实验和验证,掌握各种工具的准确性和效率。
3.阶段三:应用推广与评估(第7-10个月):
在中文系学生中推广应用AI工具,收集反馈和改进建议,评估工具在实际论文写作中的应用效果和提升程度。
4.阶段四:成果总结与推广(第11-12个月):
撰写项目总结报告,推广项目成果,包括学术论文发表、技术分享和应用案例展示等。

项目成员都具有大语言模型的使用经历,项目负责人尝试过市面上的各类大语言模型,有过对采用卷积神经网络(CNN)的AI模型进行微调大型预训练(LORA),所有项目成员具有中文语言学的背景,能够有效结合技术和实际应用需求。
1.大型数据集:项目需要大量的中文文献数据集用于模型的使用和测试。我们计划通过与图书馆和学术数据库合作,获取必要的数据资源。此外,我们还将利用公开数据集和爬虫技术,收集更多的文献资料。
2.资金支持:项目的全面实施例如模型的使用需要一定的资金支持。我们将通过申请大学的创新创业基金解决资金问题。
3.技术细化和优化:虽然我们已经有了一些基础,但在文献资料整合的具体技术上仍需进一步细化和优化。我们计划通过不断的实验和验证,改进工具流程的准确性和效率。同时,我们将关注最新的AI技术发展,及时引入先进的方法和工具。
4.推广和应用支持:在项目的应用推广阶段,我们需要获得中文系师生的积极参与和支持。我们将通过工作坊和培训课程等方式,向师生介绍AI工具的使用方法和优势,鼓励他们在论文写作中尝试使用这些工具。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 5000.00 总预算 2000.00 3000.00
1. 业务费 2500.00 各项业务 800.00 1700.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 1000.00 参加学术会议 300.00 700.00
(4)文献检索费 500.00 文献索要 300.00 200.00
(5)论文出版费 1000.00 论文出版 200.00 800.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 2000.00 平台使用费、购买软件 1000.00 1000.00
4. 材料费 500.00 购买书籍、复印资料 200.00 300.00

项目附件

  • 黑龙江八一农垦大学_人工智能技术在文献资料整合中的应用_2024年06月27日12时34分57秒doc-笔杆严格版检测报告单-20240627.pdf
    下载
结束