Migdal

Xirdim
Xirdim

Posted on • Updated on

紋典 ― 知覚世界の記述としての人工言語の辞書構造

ご無沙汰しております,受験勉強中の Xirdim です。(え?

今回は,3〜4 年前から構想している(制作中にはなっていない)人工言語辞書の構造「紋典」( schematicon )について記したいと思います。

理由は,制作開始がまだ先になりそうだからその時までに忘れないため。制作開始が先になりそうな理由は,今のところ制作技術がないのでその勉強をしなきゃいけないことと,詳しいことは言えませんが高校大学とは別系統で今後数年間忙殺されかねない兆候があるからです。(なので受験終わってもあんまり浮上頻度上がらないと思います。ごめんなさい。)

以下では説明のために認知科学系の用語を導入しているところがあります。なにか間違っていたりしたら是非教えてください。

前提概念

以下の説明をするにあたって,前提概念として「抽紋 (ちゅうもん) 」(スキーマ, schema )を導入しておきます。

一人一人のヒトは普段生活している中で,絶えず世界(自分自身を含む)を知覚し,経験しています。その中で,たとえば歩く・ドアノブを回す・自転車をこぐ・ジャンケンする等々(抽象度は何でもいいです),繰り返し起こる知覚経験に都度パターンを見出して,それぞれ同じ類いの物事として認識します。ここで抽出されたパターンのことを,認知科学の用語で「スキーマ」と呼びます。(合ってるよね?)

そして,認知言語学では,言語のことをヒトの認知的現象として捉えます。したがって,言語の文法(統語)や語,意味といったものは全て,個々のヒトが具体的な言語経験から抽出してスキーマとして振る舞っているということを前提とします。

ちなみに「抽紋」というのは,わたしが勝手に作った schema の訳語です。「抽出/抽象化された紋様 (パターン) 」ということでそのままですが,今のところ他の人に通じる言葉ではないのでお気をつけください()

この辞書構造の射程

わたしの人工言語・架空世界制作の目指すところは,その架空世界に生きる人の知覚世界を(芸術作品として)えがくこと です。(これについては今度また別記事で書こうかと思います)

そのため,ここでお話しする辞書構造「紋典」もまた,知覚世界の記述としての人工言語記述を目指すものになるわけです。

考え方と構造

知覚世界の記述として言語を描くうえでは,やはり認知言語学で前提とされている考えかたが割と馴染みます(あくまで〈科学を作品づくりに使っている〉のであり〈科学をやってる〉のではないことに注意)

形式と意味を別々に書く

まず,当たり前のようですが,言語を象徴構造(いわゆる記号論的な「記号」)として捉えます。象徴構造は形式と意味の対のことです。当然ながら意味も知覚経験です(というか知覚経験こそ意味だといっても過言ではないはずです)から,意味は重要視されます。

よって紋典においては,形式(文法とか語形とか)だけでなく意味についてもそれなりに記述する必要があります。

意味記述の重要性については,例のアルカ論とかでも散々指摘されてきました。たしかに幻日辞典(アルカの辞典です)では,多くの見出し語のなかに「語法」欄や「文化」欄を設け,その言葉の概念の周辺事項を含めた百科事典的な意味記述1をしています。

紋典ではこれを発展させて,思い切って意味の記述を,形式の記述から分離します。それが辞書構造としてどう強いのか,まだ分からないと思いますが,次の節で明らかになります。

布領 (フレーム) 単位での意味記述

日本語の「買う」という動詞や「商品」という名詞の意味を説明しようとすると,どう頑張っても,売買とはどのような行為であるかという知識が前提になります(あるいは売買についての説明から入らないといけません)。

言い換えれば,売買という "全体" に関する諸々の知識を以て,はじめて「買う」とか「商品」といった "部分" が理解されることになります。

ここでいう売買全体に関するいろいろな知識の総体のようなものを,「布領 (ふれい) 」(フレーム, frame )と呼びます(例によって「布領」は勝手に造語しました2。この布領の中から,「買う」という行為や「商品」というモノのような一部分をハイライトする3ことで,私たちはそれらの語の意味を理解しているのです。

ちなみにフレーム問題のフレームです,と言ってピンとくる方には,「知識の『総体』がどこまでか計算できないというのがフレーム問題だというわけです」と言っておきます。

辞書構造に話を戻しましょう。幻日では辞書項目に関連知識も書く形です。なので次のように,布領っぽい内容が複数の項目間で分散してしまって,関連語の項目を場合によっては幾つも参照させる(さもなくば同じことを何箇所も書く)羽目になります(断っておくと,人工言語の記述として間違っているとか言いたいわけではなくて,ソースコードの保守として見たときに手間だよねと言いたいだけ

aalsel
[歳時記]祭日
[…中略…]
[語法]
祭日はaalselで、平日はleimselという。aalselはniansel(休日)とxamelsel(催日)に分かれる。休みになるほうがnianselで、それ以外がxamelselである。[…後略…]

niansel
[名詞]休日、祝日、国民の休日
[…中略…]
[語法]
→aalsel
「祝日」の訳語はnianselに当て、休日と同一視し、祭日と区別する。
公共機関、行政機関、金融機関、教育機関はpartが固定の休日。partは機関そのものが休む。そこに勤める人間はpartのほかに個々人で一日休みを取る。その曜日は機関自体は活動している。
partが公の固定休なのでpartに休みを合わせる企業も多く、事実上の日曜日に相当する。

part
[悪魔]パルト
[歳時記]光曜日、日曜、休日、公休、公休日。週の第7日目。
[…後略…]

そこで,意味の記述を形式の記述から分離し,意味のほうは布領一枚につき一つの見出し語(見出し布領?)にして立項するとどうでしょうか4。先ほどの例でやるとこんなイメージです(あくまでイメージです。わたしはアルカに詳しくないので以下の内容が正しい保証はありません)

歳時記
この項目では暦のうちの主に文化的な側面を扱う。
[…中略…]
アルバザードでは,普段の出席や出勤を休むことになる日(=休日)が設けられることが多い。公共機関・行政機関・金融機関・教育機関は光曜日(週の第 7 日目)が固定の休日で,機関そのものが休む。また,そこに勤める人間は光曜日のほかに個々人で一日休みを取る(その曜日は機関自体は活動している)。光曜日が公の固定休なので光曜日に休みを合わせる企業も多く,事実上,日本でいう日曜日に相当する。なお,日本語でこの「休日」について言うときは,文脈によって「祝日」と訳してもよいだろう。
また,さまざまな物事を記念したり祈念したりする日として催日があるが,催日は休みにはなるわけではない。
催日と休日とをあわせて祭日といい,祭日でない日を平日という。
[…後略…]

でもって,形式側の見出し語では

aalsel
[歳時記]祭日

niansel
[歳時記]休日、祝日

part
[悪魔]パルト
[歳時記]光曜日

です。下線のところは布領の項目にリンクさせます5。(上の書きぶりでは形式側の内容が薄く見えますが,実際にはアクセントのこととか曲用のこととかコロケーションのこととか,形式面で色々書くことになります。)

布領という,実際にヒトが意味というものを扱っている単位に寄せて記述することで,ソースコード的にも DRY に書くことができます。

形式側の記述は語彙も統語も

紋典においては,形式側には語彙的なことだけではなく文法(統語)的なことも書きます

これは認知言語学の,文法と語彙とを明瞭な境目のない連続体にみなす考え方に着想を得ています。統語も語彙も,抽紋に基づいているという点では同じ。また語彙的だったものが文法化するような現象があるからには,ある一箇所で文法と語彙を線引きすることなどできないというわけです。

そこで,線引きができないなら区別なく全部辞書に書いてしまおうというの紋典の発想です。すると文法書と辞書の記述が被らなくて済み,資料の保守管理が容易になるという,人工言語制作者にはうれしい副産物があります。自然言語と違って,人工言語だと助詞とか(文法語)の語形にも簡単に「改訂」が入りかねないですからね。

辞書構造の中で文法と語彙をまとめて扱うには,「見出し語」という概念を拡張する必要があります。「語」以外の単位も辞書項目になるからです。紋典では,先ほどから言っている「抽紋」にちなんで,これを「見出し紋」と呼びます。

日本語でいう「りんご」「歩く」のような通常の「語」以外に,〈名詞〉〈動詞〉のような抽象的な単位であったり,〈節〉〈文〉「手を染める」「当たって砕ける」みたいな大きな単位も,見出し紋として立項します。そして見出し紋どうしを互いに〈抽象-具体〉6〈全体-部分〉で対応づけ,次のようなネットワークを作ることで管理します:

 $名詞 → 手
  ∧    ∧
$動詞句 → 手を染める < を ← $助詞
  ∨    ∨
 $動詞 → 染める

※ "→" は〈抽象→具体〉,">" は〈全体>部分〉。
※ ここでは抽象項目に「$」を附しておきました。
※ ここではかなり単純化して書いています。
  本当はもっと抽象具体の段階とかが間にあるとおもう
Enter fullscreen mode Exit fullscreen mode

ところで(日本語の例ばかりですが)「を」の用法のなかに,「小道を歩く」「山を登る」のように移動経路をとるようなものがあります。こういう説明,文法書に書くか辞書に書くか困りますよね。でも紋典なら,$経路 を $移動するのような見出し紋を立てて,部分構造にを指定しておけば済みます。

もちろん他の人に文法を説明するときに,このネットワーク(の遥かに巨大なの)をドンと突き付けるわけにはいかないので,いずれ文法書を書くことにはなります。が,言語を改訂するときは紋典の加筆修正に専念し,文法書は人に伝えるために,紋典の記述に基づいて書くという棲み分けがハッキリします。これにより,「文法書と辞書のうち片方を直し忘れて自分でもどちらが新しいか分からない」みたいなことが起こらなくなります。7

なお,もうお分かりだと思いますが,語だけを書く「辞典」でもなく,文法だけを書く「文典」(=文法書)でもなく,抽紋をまとめて書くから「紋典」( schematicon 8)です。

個々人の知覚世界を抽象化して描く ― 変種の導入

紋典は(架空世界の)人の知覚世界をえがくことを志向した辞書構造です。が,一人の個人の知覚世界を書くだけではわたしの気が済まない(というか,具体的すぎて記述が無理;人工言語の記述というか小説になっちゃう)ので,個々人の知覚世界を抽象化して一つの紋典にまとめる必要がありますね。当たり前じゃんと言われそうですが,どこまでも個々人の知覚世界にベースを置くところが肝です。

そのため,(架空世界の設定をもつ人工言語を扱う)紋典では,基本的にはその世界の全ての言語を一つの紋典で記述することになります。

…は?

具体例を挙げましょう。ある地域では,言語 A を話す集団と言語 B を話す集団がいて,互いに交流が盛んです。言語 A と言語 B を両方喋れる人もそこそこいます。

お分かりでしょうか。その世界に n リンガル (n≧2) の人がいるなら,その人の知覚世界には複数の言語が共存していることになります。人の知覚世界に基づくのなら,これを分断して別々に記述するわけにはいきません。

紋典では,地域方言も社会方言も別言語もひっくるめて「変種」( variety )と呼び,布領や見出し紋に変種を "ラベル付け" することで管理します。言語 A の話者の知覚世界は言語 A でラベル付けした布領や見出し紋によって記述し,両方喋れる人の知覚世界は両方含めることで記述する,というわけです。

複数の変種を一つの紋典にまとめると辞書構造上の利点として,借用語があっても原語を簡単に参照することができます。さらに,「方言なのか言語なのか微妙だから辞書を分けるかどうか」みたいな困り方もしなくなります。また,各変種に対して説明用のページを用意すれば,「この地域ではこの方言を話す集団がある」「こういう専門用語を使う集団がある」みたいな記述も,紋典の中に集約することができますね。

まとめ

まとめると,紋典は次のような構造になります。なお,ここまで文法や語彙のほうを「形式」と呼んできましたが,コンピュータのデータ形式とかとゴチャつくので,紋典では形式と意味のことを能記と所記(シニフィアンとシニフィエ,仏: signifiant signifié ,英: signifier signified )と呼びます。

  • 所記極( signified pole 9
    • 意味について,布領単位で立項する。
  • 能記極(
    signifier pole
    • 文法や語彙について立項する。このため様々な抽象度・粒度の見出し紋ができる。
    • 各見出し紋には,どの布領のどの意味を担うのか書くとともに,アクセントなど言語形式としての振舞いを記述する。
    • 見出し紋どうしは抽象具体・全体部分で紐づけて,ネットワークを形作る。
  • 変種(
    variety
    • 地域方言・社会方言・個別言語をひっくるめてこう呼ぶ。
    • 辞書構造上は,各変種は布領や見出し紋につけるラベルとして機能する。
    • なお,各変種にはそれについて説明するページを用意し,それを扱う話者集団が何か,また地域はどこで年代はいつかなどを書く。

繰り返しになりますが,紋典は構想中の構造です。ダジャレじゃありません。まだ誰も実践したことがない(はず)なので,気づいていない困りごとが出てくるかもしれません。そういうときは大抵出てきます。

それでも,この記事が,架空世界の人工言語の辞書構造について考える面白い話題提供になったら幸いです(クリシェな締め)。あるいは誰か実装しといてください。


  1. 意味記述が「辞書的」ではなく「百科事典的」だというのは,認知言語学でよく使われる言い回し。 

  2. 「布」は周辺知識の広がりを表し(cf.「分布」),「領」は「認知ドメイン」にちなむ。 

  3. 認知言語学の用語でいうとプロファイル(だと思う) 

  4. 当然ですが,ある個人の「自分の部屋の配置に関する布領」とか「12月25日午後3時に視界に入ったものの布領」みたいなのを辞書に書いても仕方がないので,人に繰り返し経験され(=抽紋となり),かつ周りの人も似たような経験をしている布領について扱うことになります。 

  5. ちなみに,国語辞典とか英和辞典とかでよく言語学用語を表す「〘言〙」,コンピュータ用語を表す「〘コン〙」みたいな記号を見かけますが,こういうのも布領のことなんじゃないかなと思います。「言語学に関する知識の総体のなかでこの意味ですよ~」と言っているわけですね。つまり私は車輪を再発明した? もっとも,言語学に関する知識の総体を載せる役割(意味側の役割)は,代わりに百科事典が担っているわけですが。 

  6. 認知文法の「カテゴリ化」と「拡張」が一緒くたになる気がしますが,人工言語辞書の管理においては大して不都合ないかなと思います。 

  7. 信頼できる唯一の情報源 single source of truth ,SSOT)の原則(?) 

  8. (ギリシア語由来の言葉で)辞書は lexicon なので,紋典は schematicon としました。ギリシア語にしたのは schema がギリシア語だからです。 

  9. 認知言語学の用語で意味極( semantic pole )・音韻極( phonetic pole )というのがあるのですが, phonetic と言ってしまうと音声言語限定な感を覚えたので,ここでは能記極・所記極にしています。 

Top comments (4)

Collapse
 
xirdim profile image
Xirdim

実は未解決だった以下の問題について。

  1. 音声言語と書記言語との関係をどう扱うか
  2. 時代変化をどう扱うか

これらは、抽紋どうしを変種間で対応づける仕組みを作ることで解決しそう。

  • A語とB語の間で対応づければ借用語に
  • 古A語と現代A語の間で対応づければ通時変化に(2. の解決)
  • 音声A語と書記A語の間で対応づければ音声と書記の対応に(1. の解決)
    • 旧仮名遣いとかのことを考えると音声と書記は余裕で多対多に対応するので意外とこれが丁度いいかも
    • 自然言語の例だと、非言語音である「zzz」(書記言語でしか出てこない)とかもあるし

という使い方ができる。対応づけそのものに説明を付記できるようにしよう。

Collapse
 
xirdim profile image
Xirdim

音韻をどう扱うかという問題があったんだけど、音韻体系を直接紋典に書くのではなく、紋典内に書かれた抽紋の総体をもって音韻体系が "読み取れる" 状態というのが着地点になりそう。

日本語において一般的には /ティ/ は /チ/ の異音だが、これはそこに最小対がない場合が多いからに過ぎず、「地位」と「ティー」のような最小対があったりする。かといって、例えば /アフタヌーンチー/ といったら明らかにアフタヌーンティーのことであるように、たとえ /ti/ で発音しようと環境によっては「地位」よりも「ティー」が優先したりする。これらの現象は、「地位」「ティー」「アフタヌーンティー」という抽紋が "ある" ことによって導き出すことができる。

ということは、造紋(抽紋を作ること)していけば音韻体系は自然と "現れる"。

ただし、造紋者が何も手がかりを持たずに進めると収拾がつかなくなるので、あらかじめ音韻を組んで念頭におきながら実際に紋典を書いていくのがよさそう。

紋典の派生物ということになるので文法書と同じ位置づけ。

Collapse
 
halka_ffez profile image
佐藤陽花

これ、必要技術は単に(グラフ理論の)グラフ構造によるデータ記述形式だという問題じゃねぇけ

Collapse
 
halka_ffez profile image
佐藤陽花

(多分ほぼ同じターゲットを認知言語側から攻めたのがXirdim、コンピュータ言語/情報数理側から攻めたのが私なのでは?)