
AI太炎
以智能技术 探文言奥妙
自主研发:深度融合古代语言知识和历史文化常识,高效构建古汉语大语言模型“AI太炎”。
核心功能:支持字词释义、文白翻译、句读标点、用典分析、难度分级等,兼容繁简中文输入。
应用场景:助力古籍整理、语文教育、辞书编纂修订、语言文化研究。
自主研发:深度融合古代语言知识和历史文化常识,高效构建古汉语大语言模型“AI太炎”。
核心功能:支持字词释义、文白翻译、句读标点、用典分析、难度分级等,兼容繁简中文输入。
应用场景:助力古籍整理、语文教育、辞书编纂修订、语言文化研究。
翻译一下:锄禾日当午,汗滴禾下土。谁知盘中餐,粒粒皆辛苦。
正午时分,烈日当空,农夫在田里除草,汗水滴入禾苗下的土地。有谁想到,碗中的每一粒米饭都来之不易啊!
作为中华语言文化的重要传承载体,古籍文献中蕴含着丰富的语言知识和历史文化常识。北京师范大学科研团队针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古汉语文本理解的大语言模型“AI太炎”。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B(18亿)参数量即可取得较好效果。“AI太炎”具有较强的古典文献释读能力,支持句读标点、典故识别、词义解释及文白翻译等多种具有挑战性的文言文理解任务,兼容简体和繁体中文输入。实验显示,与大型通用模型和其他专用模型相比,“AI太炎”在多项古汉语信息处理关键任务上表现出明显优势,且达到了接近或超过人类基线的水平。
研发团队始终密切关注用户反馈,对模型进行了持续迭代优化。2023年11月,“AI太炎”1.0版发布内测。2024年8月,“AI太炎”2.0公众版正式发布。2025年8月,“AI太炎”3.0版问世。目前,“AI太炎”的用户已覆盖我国全部34个省、自治区、直辖市和特别行政区,以及日本、韩国、美国、越南、比利时等十余个海外国家和地区。
研发团队正在积极探索相关技术在古籍整理、语文教育、辞书编纂修订、学术研究等领域的落地应用。例如,团队与中华书局·古联公司建立了深度合作,依托中华经典古籍库的高质量数据资源,进一步提升大语言模型在古籍整理数字化和智能化领域的应用效能,为我国古籍保护与文化传承提供技术支撑。此外,以“AI太炎”的注译功能为基础,团队还构建了古汉语历时词义语料库DiscoCC,并面向辞书编纂修订、文言文教学等场景研发了系列算法和资源,持续助力语言文化的传承与传播。