はじめに
みなさんお久しぶりです。ちょいちょいお目にかかりますCL-KIITA代表の佐藤陽花です。
私たちCL-KIITAは、汎用の人工言語コードであるCLAコードと並行して、LIISコード(Language Information Interchange Supplementary Code)を(一応)策定・運用・管理しています。
これは、コンピュータ上での利用欲求の高いものの既存のISOコード、CLAコード、或いはIETFタグなどの言語コードに採録されていない、或いは不十分であるものについて、適切な状態になるまでの間補助することを目的としています。
なお、詳しくは次の記事をご覧ください。
LIISコード:言語情報交換補充コードの提案
佐藤陽花 が CL-KIITA: 人工言語知識情報・情報技術事業体 へ執筆 ・ ’22年2月23日
規格仕様の補遺
原提案に規定漏れを見つけたので、この場を借りて補遺させていただきます。
LIISコードに使用可能な文字種はCLAコードと同様にASCII英小文字のみとします。また、原語名称のASCII転写によって個々のコードを定めることを原則とします。
LIISコードのIETFシステム対応化について
現行の情報システムにおいては残念ながらIETF形式しか扱えず人工言語の指定に難があるものが多くあるので、CLAコードにおいてやむなくIETF対応形式への変換措置を設定しているところでありますが、それと同等の措置をLIISコードにも同様に適用する手法を規定します。
すなわち、次の通りとします。なお、k, l, aの部分に対応するものは原提案と同じです。
x-liis<kk>-<llll>(<aaa>)
記事投稿サイトや辞書など、CLAコードでの識別を実装しているソフトウェアやサービスの管理者に置かれましては、同様にLIISコードも対応していただくよう宜しくお願いします(特にここMigdal(SNS)の管理者であるAIさん ( @a_i ))。
※とはいえ、正規化の処理は(コード管理システム以外では)プログラム上では必須ではなさそうです。
イスクイルのLIISコード発給の告示
イスクイルを用いて記述された文章を識別子を与えてたいという欲求が存在し、人工言語コードの規定の求めがあったので、これに対処することにしました。
調査したところイスクイル全般を指示するen:ithk
が指定発給してありましたが、請求人の陳述によればイスクイルの各版は互いに違いが大きいとの指摘があったので、別言語として扱うことが妥当であると思料するところであります。
したがって、イスクイル制作者のCLAコード申請のあるまでの間の補助として、次の通りイスクイル3及びイスクイル4のLIISコードを指定し発給します。
なお、en:ithk
については従前指定のものについて指示対象の変更を行うものとなります。
en:ithk
:イスクイル 全般、特にv1(とv2)
en:elrt
:イスクイル v3 (v3非正式一般自称/ɛ'laɾ.tkʰa/より)
en:matr
:イスクイル v4 (v4非正式一般自称/mal'ɤʊ̯θʁaɪ̯t/より)
※CLAコードは原則として制作者本人の申請を要するため、LIISコードでの対応を行います(制作者本人と連絡がつく場合、(並行して)本人に申請を訴求してください。(その方が望ましいあり方ではあります))。
Top comments (3)
@a_i
実装おなしゃす!!!!``
m(❁ _)m
ありがとうございます。コード表現の重複があるとややこしいため、とりあえず他のコードでカバーできない人工言語だけ対応ということなら比較的簡単に実装できるかと思います。
また、今後コードの登録体制の見直しを考えています。
当面として他のコードでカバーできない分だけ対応という件了解です。但し、ISOコード(及びそれを採取しているIETF)にある人工言語コードは除去した上でカバーできているか否かを判断してください。