Migdal

YK
YK

投稿

komofoco語【第14回人工言語コンペ】

お題

特定の身分や職業や立場の人間たちが用いている言語を作ってください。 架空の身分や職業でも構いませんし、言語を話せるならば人間でなくても可。

komofoco語の概要

この言語は架空の世界の統計学者が扱う言語である。
この世界の統計学者は頭の中で0〜1000までの整数がランダムにでる乱数を頭の中で振ることができる。
この言語が統計学者の中で使われるのかというと、これを使えるということ自体が確率や統計の理解や高度なメタ認知能力を有してるという証明になるからだ。

はじめに

初めまして!YKです
今回初めての参加のため、至らぬ点が多くあると思いますが、是非とも温かい目でご覧いただけると幸いです。
っと、前置きはここまでとして、なぜこのような言語を作ったのかを説明します。ずばり、来年から情報系の学部に進学予定だからです!
そのため最初はプログラマーが使う言語を作ろうとしましたが、すでにプログラミング言語があったため断念しました。そこで、情報系ではそこそこ使うであろう統計に目をつけ、このような言語を作ることに決めました!

言葉の定義

θは確率や割合を表すパラメータである。

子音確率は各単語ごとに設定されているどれくらいの確率で特定の子音が出現するかを表した確率のこと。

分節助詞は意味を持たず、語の切れ目だけを示す助詞のこと。

子音確率の反転とは各語に含まれる子音確率を大きさ順に並べたとき、その順位を逆転させること。
また、同一の確率値を持つ子音が存在する場合、それらの相対的な順序は変わらない

エントロピーとは不確実性や情報量の尺度のこと。ざっくりいうと、エントロピーが大きい=予想しずらい、エントロピーが小さい=予想しやすいということ。

音韻論

この言語の文字はラテン文字である。
この言語では基本的に子音+母音がセットで発音される。一部の例外を除き、子音のみで発音されることはない。同様に母音のみで発音されることも例外を除き基本的にはない。
また、母音はそれぞれ意味を持っており、どの母音を使うかは話者が一定のルールのもとで決めることができます

母音

文字 発音 (IPA) 備考
a /a/ 子音が高い確率(40%<θ)であることを表す
i /i/ 子音が真ん中くらいの確率(10%<θ<40%)が確率通りであることを示す
u /u/ 子音が低い確率(θ<10%)ことを示す
e /e/ 子音が確率通りであるであることを表す
o /o/ 確率に関係なく、話者が意図的にその子音を選んだことを表す

また、母音には長母音もあり、それぞれ
ā,ī,ū,ē,ōで表し、基本的に文法事項で使われる

子音

文字 発音 (IPA) 備考
p /p/
b /b/
f /f/
v /v/
t /t/
d /d/
c /s/
z /z/
l /l/
r /r/
s /ʃ/
j /ʒ/
k /k/
g /ɡ/
h /h/
x /ʁ/
q /tʃ/
š /t͡s/
ž /d͡z/
n /n/
m /m/
w /w/
y /j/

文法事項

子音確率と言語の本質

各単語には子音確率が定められており、決まった形を持たないため、生成される単語の形は毎回異なります。
例えばある動詞の子音確率がt:50%,s:40%,n:10%の場合、
子音がttsやsnt,nnnとなる可能性がある。
つまり、単語は確率分布であり、音声はサンプルである
そのため、100%自分の意思を伝えるために、同じ文章を何回も言うと言うことがたまに起こる。
(統計的に試行回数が増えれば伝えたい文章へと収束する傾向にあるから)

品詞と子音

子音の数は品詞によって明確に決まっている。
ま動詞は完了動詞と未完了動詞の2つがある

代名詞、指示詞、簡単な数詞は2個、簡単な接続詞、前置詞
未完了動詞は3個
名詞は4個
完了動詞は5個(確率子音の個数は3個で未完了動詞と同じ)
形容詞、副詞は5個(確率子音の個数は5個)
接続詞は6個となっている。
また、この品詞の子音数と子音確率要素数は一致する。
形容詞と副詞はそれぞれ独立した品詞ではなく、一つの品詞として使われる。
つまり、動詞なら必ず◯,△,⬜︎の3つの子音をもち、名詞なら必ず◯,△,⬜︎,×の4つの子音をもつ。そしてこれらの子音にはそれぞれに確率パラメータθが定められている
例:ある動詞はt:50%,s:40%n:10%となる。

統語論

基本的に語順はSVOだが、
疑問文ではこれがVSOとなる。
修飾語は後置。
また、名詞には接続詞機能を兼ねるものもある
(日本語で言えば「〜結果」や「〜ため」など)

名詞

名詞は単数の形しかなく複数形を表すには同じ名詞を2回繰り返すことで表せる。これは代名詞や指示詞でも同様である

所有格名詞の所有格を表すには名詞の最後の母音を長母音変換することで所有格にすることができる

は前置詞で表し、名詞の前に置く
具格はr:99%,l:1%
奪格はd:99%,k:1%

動詞

否定形は子音確率の反転を行う。
例えばある動詞はt:50%,s:40%,n:10%の否定形はある動詞はt:10%,s:40%,n:50%となる。
また、動詞の直後の文節助詞の発生確率も反転する。つまりnは5%で、mは95%で出現するようになる

過去形は動詞の語尾にeをつける。
例えばtatanuという形を過去形にしたい場合は
tatanuēとする。

未来形は動詞の語尾にīをつける。
例えばtatanuという形を過去形にしたい場合は
tatanuīとする。

進行形は動詞の一番最初の母音を長母音にすることで進行形となる
例えばtatanuという形を進行形にしたい場合は
tātanuとする。

完了形は未完了動詞を単純に長くしたもの。
つまり、確率子音の内容は変わらず、単語の長さが3個から5個になっただけである。

動詞の副詞化は動詞の真ん中の母音を長母音にすることで表せる

文節助詞

この言語では単語の区切りを明確にするためにn,mといった文節助詞を使う 
このn,mは乱数で決め、それぞれn:95%,m:5%の確率で出る。

推定法

この言語の平叙文はエントロピーの大きさによって、叙述文、推定文、有意文の3つの種類に分けられる

エントロピーはa,i,uが多いほど大きくなり、oが多いほど小さくなる
eはエントロピーに影響を与えない、小さくも大きくもならない。

叙述文

エントロピーが大きい場合はこの文となり、
簡単にいうと普通の文であり、この文を使う場合は母音oは使われない

推定文

何かを推定するときにこの文を使う。推定の強さはエントロピーの強さ(oの多さとa,i,uの少なさ)に依存する

有意文

わかりやすくいうなら断定文。エントロピーが極めて小さい場合にこの文となる。この文は母音のほとんどがoであり、a,i,uは使われない

比較級

SはOよりCでV(ある)という比較級の文章は
SOCVという語順になる。
また、この際、Oの直後に来る文節助詞の確立を反転させる(n:5%,m:95%)
また、この比較の偏差は形容詞の母音がどれだけ長母音化するかによって表す。
例えば、tatatatataという形容詞があったとして、
tatatatatāとtātātātātāなら後者の方が偏差が大きいということになる

否定文かつ比較級の場合の文節助詞m,nはXORのように互いに打ち消す。
つまり、否定文かつ比較級の場合の文節助詞は(n:95%,m:5%)となる

文の名詞化

ある文について名詞化する時、
文の初めにmō、文末にnōをつけることで名詞がする

単語帳

代名詞・指示詞

子音確率 意味 備考
j:90%,f:10% 一人称
t:90%,d:10% あなた 二人称
s:50%,h:50% 彼・彼女 三人称・生物
z:90%,t:10% それ 三人称・無生物
n:90,g:10% これ
b:90%,r:10% あれ

動詞

子音確率 意味 備考
t:10%,s:40%,n:50% 〜をする
p:20%,x:30%,q:50% 〜を食べる 何かを摂取する行為全般に使える
b:30%,h:35%,d:35% 〜を使う
m:20%,k:40%,z:40% 〜を作る
n:30%,l:35%,z:35% 〜を分析する
c:10%,s:20%,p:70% 〜を推測する
r:20%,g:35%,w:45% 明らかである
f:20%,y:20%,b:60% 〜を考える
g:20%,f:40%,v:40% 〜である 存在を表す動詞。英語で言えばbe動詞

形容詞

子音確率 意味 備考
p:5%,q:5%,f:10%,h:10%,l:70% 統計学的に
v:5%,b:5%,m:10%,x:30%,p:50% 確率的に
n:10%,k:15%,m:25%,g:25%,x:25% 間違っている
c:10%,y:10%l:10%,v:30%,b:40% 正しい ---

例文

1.統計学的に考えて明らかである
訳:zoton wogoron lahovumubom fibōyo

2.それ間違えてると思う
→私はそれが間違っていると考える
訳:jafon babayon mō zaton fovagom xagomonokon nō

3.それは統計学的に明らかなの?
訳:wagiwan zaton lalahipilan?

4.それはこれより統計学的に正しい
訳:tuzan nagom bācōyōlōvēn lahovomobon fagove.

人気順のコメント(0)