[CL]《ConlangCrafter:ConstructingLangua

爱生活爱珂珂 2025-08-12 06:32:29

[CL]《ConlangCrafter: Constructing Languages with a Multi-Hop LLM Pipeline》M Alper, M Yanuka, R Giryes, G Beguš [Tel Aviv University & UC Berkeley] (2025)

ConlangCrafter:利用多跳LLM流水线实现人工语言构建

• 采用多阶段模块化设计,分解语言设计为音韵学、形态学、句法、词汇生成及翻译五个步骤,逐层构建语言结构。

• 利用大型语言模型(LLM)的元语言学推理能力,结合随机数生成器注入随机性,确保生成语言的类型学多样性与创新性。

• 引入自我改进机制(self-refinement),通过模型自我批评与修正迭代,显著提升语言内部一致性和翻译的逻辑连贯性。

• 支持“构造性翻译”,在词汇及语法尚不完整时动态扩展语言描述,实现对新句子的准确翻译与注释。

• 自动化评估框架基于世界语言结构数据库(WALS)特征,量化语言的类型学多样性和内部一致性,验证生成语言既丰富又符合语言学逻辑。

• 允许用户输入约束,实现按需定制,支持测试创意、哲学及语言学假设,展现极强的灵活性与应用潜力。

• 输出语言涵盖多样语音系统、句法结构及形态特征,甚至包括无辅音体系、气味语法、色彩音素等极端创新案例。

• 具备潜力辅助低资源语言研究、游戏世界构建及语言学理论探究,开启计算创造性语言构造新范式。

深入解析表明,分解任务与随机注入共同促进输出多样性,自我改进有效纠正逻辑矛盾,突破了单次提示生成的局限。ConlangCrafter为语言构建者提供强大工具,兼顾创造力与科学严谨,推动人工语言生成迈入系统化、可控化新时代。

了解详情🔗 arxiv.org/abs/2508.06094

项目主页🔗 conlangcrafter.github.io

人工智能计算语言学大型语言模型人工语言语言生成自然语言处理

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注