AIが独自の人工言語を自動生成、研究に新手法
新言語を自動生成
7000超の自然言語と別系統
音韻・統語規則を自動適用
編集ループで矛盾を修正
乱数で多様性を確保
研究の意義と展望
既存LLMより2倍多様
整合性は約7割向上
言語構造と性能の検証用途
無料公開と今後の課題
詳細を読む
カリフォルニア大学バークレー校の言語学者ガシュペル・ベグシュ氏らの研究チームは6月27日、独自の人工言語を自動生成するAIモデル「ConlangCrafter」の能力を分析した論文を計算言語学会の会議録で公表しました。同モデルは、規則を一貫して守りつつ多種多様な新言語を作り出せると報告しています。
人工言語は、ドラマや映画のために創作されるドスラキ語やクリンゴン語などが知られています。研究チームは、人間が想像し得ない言語をAIが生み出す点に価値を見いだしており、音を使わず色や身ぶりで伝える架空の生物向け言語のような、非人間中心の言語の研究にも応用できると見ています。
同モデルは、音の組織化を扱う音韻論、語と文構造の関係を扱う形態統語論、そして語彙にわたる幅広い言語規則を適用できるよう設計されています。乱数生成器が変化を加えて毎回異なる言語を作り、組み込まれた編集ループが矛盾を点検して修正する仕組みです。利用者は規則を自由に選ぶことも、モデルに任せることもできます。
チームは、生成された言語が語順などの言語的特徴でどれだけ互いに異なるかで多様性を、各言語の規則に翻訳が正しく従うかで整合性を評価しました。汎用大規模言語モデルのGemini-2.5-Proと比較したところ、同システムは単純に生成を指示する場合より約2倍多様で、整合性は約70%高いとしています。
研究に関与していないカーネギーメロン大学のデビッド・モーテンセン氏は、言語構造がモデル性能に与える影響をこのツールが科学的に検証する助けになり得ると指摘します。ConlangCrafterは無料で公開されていますが、開発者らは意味論や文脈的な使用、文字の視覚的側面といった複雑な領域では現状に限界があると認めています。