要旨
お久し振りです。あづまにゃんです。さて、私の記事は日本語のことばっかりでしたが、今回はみぐだるらしく、人工言語に関する話題です(歴かなは日本語じゃないのであえて使わずにいこうかしら)。
テーマは、人工言語"で"本気で研究してみる。
人工言語それ自身を研究の対象にするのも含みますが、人工言語的手法を用いて言語学的な何か研究を本気でやってみるというのが本記事の目的です。
人工言語界隈または人工言語作者の方々は、人工言語を作り、またその過程で何か言語に関する知見を得ることが多いことと思います。そこで、その知見などにも焦点をあてて、そこから得られる知見などを構成的に得たり、本気で研究の対象にしてみようという、いわゆる人工言語学を本気で構成してみようというのが今回の目的です。構成くらいはちょっとだけ論文調に書いてみますよ。
第一章:人工言語学の現在(先行研究)
さて、人工言語を研究の対象にしてみるということで、きっとここの人たちは人工言語のコミュニティ事情についても詳しいとかなんとなく知っているという人が多いでしょうから(というかみぐだる他をみれば大体人工言語を制作することによって何が得られるかは大体分かったりなにを考えているかを感じられると思いますから)、それを飛ばして、学術研究、論文などの観点から人工言語を見てみようと思います。
既存の人工言語学的な研究の大観は、論文だったら怒られますが、記事なので適当に書くと、現在の人工言語研究は、(比較的に明示的に行われている分野またはそう指摘されている分野としては)既存人工言語等の研究、心理・言語学的視点による種種の研究(多くは言語獲得に関する)、自然言語処理や情報処理などコンピュータと言語に関する研究(プログラミング言語もまた然り)等が大半です。実際には、広範な分野で実験的に人工言語を簡易的に作って用いるということはされていますが、もはや当事者に人工言語を作っている意識はないほどの小ささです。
更に言えば、別にそんなに数があるわけでもないです(正直、人工言語に関してはこういったコミュニティの方がはるかに活発に活動していて、知見も多い)。J-StageやGoogle Scholar等で検索してみると分かりますが。というか、プログラミング言語等を人工言語の代表例として出す(危うい)文献も結構多いので、研究者と一般人との認識のずれなのかなんなのか、本気で人工言語を知る気がないものもあり、ちょっと検索避け等が大変です(勿論他分野等の研究等を本気の目的としているのだろうから悪いわけではないが)。
そんな諸先行研究を分野分類別に分けて見てみましょう。
第一項:既存の人工言語に対する研究
これは、昔から行われてきたことで、これは例えば、エスペラント等が代表例で、言語学に関する様々な文献で言及されていることがあります。有名な文献でちょこっと触れられていることも多いのかな?
勿論、ロジバンやトキポナ等の研究も細々とやっている人は英語圏にいるっぽい……が。
正直、自然言語に対しての研究のちょっと変則的な感じ、歴史等も含む研究という感じであり、人工言語"を"研究していて、今回の主題ともちょっと離れそうなので、あと、ここの人たちもよくやっていてよくしっていそうなことなので以上で留めます。
第二項:他分野等での小さな人工言語を用いた研究
他分野(特に心理・認知言語学、また自然言語処理等)の研究で、そこに手法として人工言語を用いるということは分野によってはよくされているようです。こういった研究では大雑把に言えば、実際の自然言語に近いような、言語として完成することを目的としているような人工言語を用いたり、作ったりするわけではないのです。人工言語を目的に合わせて、ちょっとだけ作ってそれによって研究するようです(だって、一般の人工言語って作るのめちゃくちゃ大変ですもんね……)。ミニチュア人工言語(MAL)という分類がされています。また、ミニチュア人工言語という意識なく、例えば刺激図形と無意味語(意味の無い何か文字の羅列など)を対応づけたもので実験するなどといった心理・認知言語学等での方法論という意識のもと使われていることも多くあります。というか殆どがこのパターンで明示的にミニチュア人工言語を使っているとするものは少ないです。
具体的な例のほんの一部
ミニチュア人工言語を纏めた日本語の文献は時代は少し遡りますが守 一雄著(1992)『ミニチュア人工言語研究 : 言語習得の実験心理学』やその基礎となっている論文(1982)ミニチュア人工言語研究等が存在します。
諸論文では、心理学的な観点から、人間の言語処理等を研究する目的でのミニチュア人工言語の分類等や、それに沿った守先生の研究手法の纏め等が書かれています。仮説に依って、ミニチュア人工言語や実験手法に最低限のものを付加していく様子が結構面白いよ★。
その他に、Rebecca L. Gómez, LouAnn Gerken(2000)"Infant artificial language learning and language acquisition"(『乳児の人工言語学習と言語獲得』)は、心理・認知言語学的に、いわゆる臨界期を迎える前の乳児の第一言語(母語)の獲得に関する研究で、文法規則をもった無意味単語列や羅列に特化したミニチュア人工言語を作り、それを乳児に聞かせ、あるいは見せて、それによって、具体的な単語をこえて、どれくらい抽象的な文法や単語の羅列パターンを認識し統計的に学習できるのかというような調査をした研究を纏めた論文です。有名な例として、Jenny R. Saffran, Richard N. Aslin, Elissa L. Newport(1996)"Statistical learning by 8-month-old infants"等が挙げられています。
正直、ミニチュア人工言語がこの記事の主眼であるので、より詳しく踏み込んで分析してみましょう。
ミニチュア人工言語を制作する上での主たる手段は、第一に、自然言語の単純化/改変です。例えば、概念事物から意思として伝えたいことを大体構造化してそれが言語という枠組みにはまるように成形加工され、→構造的な言語データが筆記、発声、手話等といった実体をもつデータに変換されこれが物的世界において言語と解釈される存在となります。そういった木構造(グラフ)で考えてみると、心理学分野でのミニチュア人工言語研究では、これらのそれぞれの矢印の前と先にある対象を簡易的に人工言語として形作り、それらの対応から得られる言語学習、獲得の流れを見ているように思えます(本当は圏論とかの枠組みで扱いたいけれど誰しもが圏論に詳しい訳ではない)(概念事物-(意思)→構造化-(言語化、文法)→内的言語(パロール?)→表現(外的言語? 言語実体?)、と分かりやすくいってみる)。
例えば、守の論文で対連合とされているものは内的言語と概念事物の矢印の関連、どのような意思であったり活動があるのか、またどういう学習が効率が良いのかを調べるために、概念事物と内的言語を人工的に用意するということをしています。概念形成型と記憶自由再生型は、統語規則、つまり内的言語のうち統語規則、単語ごとの関連性がどういう風に影響して、それが言語化等の矢印にどう影響をするかのために、内的言語を人工的に用意するという研究です(そして内的言語であったり統語規則であったり言語のそういった構造的な部分についての数理的な研究というのはかの有名な生成文法という者が存在し、この矢印の内的言語や構造化の中にさらにこういう矢印構造を取り入れることができたりする)。受容方略と生産方略は具体的に矢印の向きの違いとその影響を調べていると言えそうです。
第三項:数学、コンピュータでの文脈
コンピュータサイエンスでの人工言語の使われ方は、前項のような他分野の研究のための手法と一緒ですが、自然言語処理や人工知能等コンピュータサイエンスの分野という心理・認知言語学的な使われ方以外ということで提示してみます(が、総合して普遍文法とか、言語一般の事実の探求ということでまとめても理解してもいい気がするような)、一方で、この分野で一番輝いている人工言語といえばプログラミング言語でしょう。
まあでも、言ってしまえばプログラミング言語は一口にいってもあまりにも広いし、この文章を書くにも使われている技術でもあり、もはやそっちの道でいろいろな発展が今日もめざましく起こっているので触れることを諦めます。実質無限にあるので。
そして、数学としては記号論理、形式論理や論理における言語などが論理を重視した、というか論理だけの人工言語といえます(プログラミング言語に通ずるところもある)。が、これらもまた人工言語とは関係なく数学の文脈で発達しまくっているので、同じく諦めます。でも記号とか面白いですし、数学に留まらず言語学で形式論理やることもあったり。
ということで、コンピュータサイエンスの研究のために人工言語が明示的に作られ用いられたものは、最近アツい分野で最近のものばかりで明日世界を変える論文が出てもおかしくはないですが……李 凌寒, 鶴岡 慶雅(2023)『人工言語による事前学習を用いた言語間転移可能な知識の分析』を挙げてみます。
この論文は、ある自然言語で学習したことがらについて、他の言語においてもその性能を発揮できることがあるので、その言語に依存しないようなことがらや言語の普遍的なことがら、それがどう影響しているかについて調べるために、それを調べやすいようなアルゴリズムで生成された言語特徴をもつ(ミニチュアとは言及されていないものの、ミニチュアに分類できる)ミニチュア人工言語モデルで学習させてそれを(転移の)もとに、それを自然言語タスクに飛ばして調べています。
第二章:じゃあ新たに何ができるのか
以上の研究等を人工言語を用いた研究として、人工言語学という視点から見るとどんなことができると言えそうでしょうか。
まずは人工言語学という見方の浸透とか、普及とかが最優先課題っぽいですけどね?
人工言語を制作する
究極、薄々思っているようなことなどとしては、これに尽きるのだと思いますが、人工言語を制作することによって得られる種種の言語に関する視点というのを言語学に生かすという必要があると思います。人工言語学というものを考えるとしたら、それは大前提でもあります。
言語制作者が多いので共感してくださる方は多いと思いますが、例えば「薬を飲む」という表現一つとってもどのような文化や語に対する意識や云々のバックグラウンドによって「食べる」とか粉薬と粒の薬は区別するとか、格は時制は主題は等々が出てきます。こういった人工言語を作ることによって自然言語の観察からでは中々得られないことがらというのは積極的に考えてゆくべきです。
また、言語一般、言語普遍の事実などを探求する上で、そのプロセスとして自然言語のみで足りないことは明らかです。今の各個別言語学の中(日本語学または、日本における言語学)においても、欧州圏、英語圏中心の言語の研究プロセスや見方がつらつらと残って支配していることを考えると(形態素などが膠着語に適した考えなのか、形態素を考えるのはたしかに大事だとしてもそれをどう分けるか、morphemeではなく日本語学における形態素としてもっと日本語に最適化できるでしょうなどがぱっと思いついた例)やはり自然言語に頼るのでなく、プレーンな人工言語を介した対照言語学的方法や分類などが有効かと思われます(言語だって数千は存在するとみられるわけで、各言語について対照言語学方法をするというのは膨大であるし、だといって英語をハブにするとしても、結局英語圏に偏った推論が行われるのは必至で、適切な分類などが必要であり、その中の自然言語に限らない方法としての提案)。
また、あることにだけを研究するために作られた人工言語の話は割と既存研究として、みんな大好き、ロジバンやトキポナ等々の例があるので後述します。
勿論、研究方法によっては人生かかりますが(人工言語を作り上げたり、分類に適した人工言語を作ったり、それを介したことをしたりする必要がある)。
### 既存研究の延長
新たな心理学、認知言語学、あるいはコンピュータサイエンス等での課題に新たなミニチュア人工言語を作って調べてみるというのは今後も増えるでしょう。例えば、人工知能に都合のよい自然言語的な枠組みの言語を作ったり検討したりする試みなど。
または、既存研究を地道に(人工言語や人工語等々と検索しても引っかからないために地道に)調べ上げそれをレビュー論文として人工言語学的視点から挙げることも必要です。
これまでのある特定の目的についてそれを調べるための言語を作ることの延長
これまでに、有名な例として、トキポナやロジバン、プログラミング言語各種、形式言語、論理に於ける言語等々、一応エスペラントも含めていいのかは分かりませんが(国際補助語という観点で)、そういった特定の目的のために制作された言語というのは数多いです(それは立派に言語である)。
であるからして、この特定の目的のために作られる言語という枠組みをもう少し深く考察して、それを更に大きな範囲において生かすべきです。
これの方法論は長くなるので、別途言及することとします。
ミニチュア人工言語の適用範囲の拡大
人工言語の適用範囲を拡大するということは夢があります(それには前述のことを行って認知を広げる必要がありますが)。言語普遍、あるいは人間普遍の事実、言語を学ぶという仕組み(ニューラルネットワークとか?)普遍の事実だけのために都合のよい人工言語を使うという方法論として、人工言語と自然言語を比較してみて、自然言語そのものを研究したり、自然言語から普遍的な事実を抽出してみるというのも面白そうです。例えば、ある集団にあることばをおしええて、それがどんな風に意味が変わったり定まったり、文法についてどういうことがいえたり、音が変化するかなど。それに限らず、こんな人工言語はどのような変遷を辿るのだろうというとか。
終わりに
人工言語というのは多様な見方を与えてくれます。もう少しスペースと時間があれば、更に詳述し、分類をしてみたいところです。
他の意見とかはあったらぜひ!! 協力してくださるかたがいたらご連絡を。
(論文にするためにこの記事は削除される可能性が存在します)
人気順のコメント(0)