Migdal

佐藤陽花 for CL-KIITA: 人工言語知識情報・情報技術事業体

Posted on • Updated on

LIISコード:言語情報交換補充コードの提案

LIISコード:言語情報交換補充コード
LIIS Code: Language Information Interchange Supplementary Code

ISOコード、CLAコード、或いはIETFタグによってコード定義されていない言語、或いはそれらの系統言語について補充し言語情報交換のために提供する言語コード。主要な言語やコンピュータ上での利用欲求の高い言語を中心に採録される。

(本提案の)筆者自身がCL-KIITA宣言を伝統仮名へ翻訳する際に直面した、以下のA.I.さんの発言に如実に表れているような問題に対処するために考案された。

しかし旧仮名も旧字体も中古日本語も中世日本語も漢文訓読体も言語コードで書けない

採録手続

採録は製作者・話者等の申請によらず、コード委員会の判断による。

CLAコード等適切な言語コードにおいて採録され、本来あるべき状態となった場合はそちらに正規化するようにする。また、正書法によるコード付与をされているもの(LIISコードにおいて種類部がorとなっているもの)、はしかるべき文字体系コードにおいて採録された場合に同様に扱う。

形式

種類(k: kind)、言語(l: language)、追加(a: additional)の三階層によって構成される7字・13字コードである。

kk:llll(_aaa)

基底部(言語部)+追加部で一意となるようにコード付与を行う。また種類部は省略して記述しても問題ない。

種類

人工言語系

  • au:補助言語 Auxiliary Languages / 知的生命体が実際に意思伝達をするために用いることを想定した言語。工学言語・実験言語・改変言語に含まれるものを除く。
  • en:工学言語 Engineering Languages / 工学的な手法によって作られた言語や、知識表現・言語研究のために作られた言語。
  • ex:実験言語 Experimental Languages / 音韻や文法などの実験のために作られた言語や、その残骸
  • md:改変言語 Modified Languages / 自然言語に改変を加えて作られた言語。
  • ar:芸術言語 Artistic Languages / 補助言語・工学言語・実験言語・改変言語に含めれないすべての人工言語

自然言語系

  • hs:古代言語 Historic Languages
  • mi:少数言語 Minority Languages
  • pc:祖語古語 Proto-languages and Classical Languages
  • or:異書記法 Different Orthographies

例示

人工言語

  • au:espo_leg:エスペラント(正規) <{iso1}eo, {iso2}epo, {iso3}epo, {ietf}eo はこれに正規化する>
  • au:espo_hsy:エスペラント(H方式) <{ietf}eo-hsistemo はこれに正規化する>
  • au:espo_xsy:エスペラント(X方式) <{ietf}eo-xsistemo はこれに正規化する>
  • au:espo_csy:エスペラント(キャレット方式)
  • au:espo_ido:イド語 <{iso1}io, {iso2}ido,{iso3}ido, {ietf}io はこれに正規化する>
  • au:espo_arc:アルカイカム・エスペラントム <{ietf}eo-arkaika はこれに正規化する>
  • ar:euro_mix:ユーロパント
  • ar:trns_mix:トランスピラント
  • ar:baro:アーヴ語
  • ar:klin:クリンゴン語 <{iso2}tlh, {iso3}tlh, {ietf}tlh はこれに正規化する>
  • en:tokp:トキポナ <{iso3}tok, {ietf}tok はこれに正規化する>
  • en:logl_log:ログラン
  • en:logl_jbo:ロジバン<{iso2}jbo, {iso3}jbo, {ietf}io はこれに正規化する>
  • en:ithk:イスクイル
  • md:engl_ang:改変英語(Anglish)
  • md:japn_kyo:改変日本語(協和語)
  • md:japn_mus:改変日本語(麝香日本語)
  • md:nsla_sev:北スラブ語(セヴェルスク語)
  • md:nsla_sla:北スラブ語(スラヴェニ語)
  • md:nsla_sie:北スラブ語(セヴォリア語)
  • md:nsla_nas:北スラブ語(ナシカ語)
  • md:nsla_voz:北スラブ語(ヴォズギア語)

自然言語

  • or:japn_trs:現代日本語(伝統仮名遣い・正字体)
  • or:japn_trn:現代日本語(伝統仮名遣い・新字体)
  • or:japn_mds:現代日本語(現代仮名遣い・正字体)
  • or:japn_mdn:現代日本語(現代仮名遣い・新字体)
  • hs:japn_emd:近世日本語
  • hs:japn_lmi:中世日本語
  • hs:japn_emi:中古日本語
  • hs:japn_old:上代日本語 <{iso3}ojp はこれに正規化する>
  • or:chan_kun:漢文訓読体
  • or:chan_gug:口訣

Oldest comments (1)

Collapse
 
halka_ffez profile image
佐藤陽花

あ、言語コード識別コードはliisですかね...