2014. 11 特集=デジタル時代の日本語

特集 : 「デジタル時代の日本語」の編集にあたって

多分,これを読まれている方の大多数は日常的に日本語を話し,日本語の文章を読み,日本語を書いて(あるいはキーボードなどから入力して)いるかと思います。しかし恐らく,私たちにとって日本語は“あって当たり前”のものであるため,言語学や国語学を専攻していたり,外国語を学んでいる状況でなければ,「日本語とは何か?」といったことを考える機会は少ないように思えます。ではなぜ,今回の特集テーマは「日本語」なのでしょうか。
私たち編集委員が各号の特集テーマを検討するとき,特にデジタル化や情報処理技術について考えるとき,時おり,そこに日本語にまつわる問題が横たわっていることに気付かされます。例えば電子書籍における日本語組版や外字に関する課題や,様々な文字種がある日本語のOCRの認識精度などがそうです。そこで,何か気になる存在の「日本語」について,「デジタル×日本語」ということに焦点をあて,特集を組むことにしました。
本特集において,家辺勝文氏には,通信技術の進展やインターネットの普及などの歴史的経緯を踏まえた上で,多言語をネットワーク上で発信・利用できるようにするための取組が技術基盤の形成に影響を与えたこと,その中での日本語処理の技術整備や日本語文書の特性,その作用と今後の課題など,多くの示唆に富む総論をまとめていただきました。
小林龍生氏には,日本語表記の特徴の一つであるルビがEPUBに取り入れられた経緯についてまとめていただきました。そして,ルビが有する視覚的な表現手法と情報蓄蔵伝達機能とを,今後どのようにデジタル環境に引き継いでいくかという,日本語特有の課題を提起いただきました。
小木曽智信氏には,日本語コーパスの動向についてまとめていただきました。コーパスとは何か,なぜコーパスの構築が必要なのか,自然言語処理技術の発展への寄与,そして国立国語研究所で構築されている様々な種類のコーパスについて解説いただきました。
相澤彰子氏には,機械による学術文献の言語解析について詳説していただきました。学術論文のデジタル化が進んだ現在,その内容分析のため,単に文献中の語を切り出すだけではなく様々な言語テキストの解析が試行されていること,その手法について具体例をもとにご教示いただきました。
永崎研宣氏には,クラウドソーシング翻刻システム「翻デジ2014」の開発・運用についてまとめていただきました。日本語のデジタルテキスト化という作業において課題となってくる字形の差異について,また典拠を明確にすることの難しさと重要性について,そしてTEIや,Unicodeにおける漢字の取り扱いの最新動向についても言及いただきました。
今回の特集で,日本語から見たデジタル化,デジタル化から見た日本語について,その現状や動向,様々な取組や課題があることを共有でき,そして「やはり日本語は面白い」と思っていただけたなら,非常に嬉しく思います。
最後になりましたが,今回の企画検討において国立国語研究所の高田智和先生から多くのアドバイスをいただきました。ここに記して感謝の意を表します。
(会誌編集担当委員:中村美里(主査),田口忠祐,長屋俊,長谷川敦史,福山樹里)

インターネットの技術基盤の国際化と日本語文書処理

家辺 勝文
やべ まさふみ
〒101-0041 東京都千代田区神田須田町1-13-1
        (原稿受領 2014.8.21)
コンピューターによる日本語処理,日本語文書処理は,日本語が日常的に使われている限られた地域内部のローカルな技術として製品化されることから始まった。しかし,日本語表記の複雑さを処理する技術は,一般的な言語処理,文書処理技術の基本的な潜在力の拡張に寄与することができるだろう。ウェブ上での情報流通が一般化する中で,すべての利用者にとって選択可能で国際的に利用可能な情報源の記述言語の一つとして日本語が位置付けられるようになる。ローカルな需要を最もよく満たす日本語文書処理技術の細部が,同時にインターネットの技術基盤の国際化を支える技術の一部と見なされるようになってきたことに注目すべきであろう。
キーワード:日本語,日本語表記,文書処理,ローカライゼーション,国際化,符号化文字集合

EPUBにおけるルビの実現 -日本語書記技術論の視座から-

小林 龍生
こばやし たつお (有)スコレックス
        (原稿受領 2014.8.18)
本稿では,ルビがEPUBに取り入れられた過程を振り返ることを通して,日本語書記体系を構成する機能要素を汎用的な国際標準規格に組み入れる際に考慮しなければならない問題圏について考察する。まず,主として近世以降の出版物におけるルビ表記の歴史を概観し,次に,ルビ表記がどのように国際標準に組み入れられていったかを概観する。その上で,表記の背後にあるルビの機能性を実現する上で,どのような問題圏が存在するかを明らかにする。
キーワード:ルビ,EPUB,HTML,CSS,Unicode,日本語,書記体系,日本語書記技術論

日本語コーパスの今

小木曽 智信
おぎそ としのぶ 人間文化研究機構国立国語研究所
〒190-8561 東京都立川市緑町10-2
Tel. 042-540-4637        (原稿受領 2014.8.26)
2012年に1億語規模の「現代日本語書き言葉均衡コーパス」が完成・公開され,日本語のコーパスは日本語学・日本語教育・自然言語処理等の諸分野において欠かすことのできない研究基盤として広く活用されている。本稿は,日本語コーパスの前史からはじめ,「日本語話し言葉コーパス」「太陽コーパス」「現代日本語書き言葉均衡コーパス」「日本語歴史コーパス」等の国立国語研究所で構築されたコーパスと形態素解析用の辞書「UniDic」について紹介するとともに,今日のデジタル時代に日本語コーパスが果たしている役割と,今後の日本語コーパスのあり方について論じた。
キーワード:日本語,コーパス,日本語学,自然言語処理,形態素解析

デジタル化された学術文献の言語解析について

相澤 彰子
あいざわ あきこ 国立情報学研究所
〒101-8430 東京都千代田区一ツ橋2-1-2
Tel. 03-4212-2524         (原稿受領 2014.9.5)
学術文献のデジタル化によって,計算機による文献の言語解析が容易に行えるようになった。現在の文献検索は,比較的単純なキーワード抽出処理に基づいているが,大量の文献をさらに言語解析することで,利用者が必要な文献を検索したり,分野全体を俯瞰したりする作業の支援が期待できる。そこで本稿では,学術文献に対する言語解析の適用とその活用法について概観するとともに,デジタル文書と言語解析をつなぐための要素技術として,デジタル文書からの自然言語文の切り出しおよび専門用語の抽出について,その必要性や難しさを論じる。
キーワード:学術文献,電子図書館,自然言語処理,XML文書,専門用語抽出,情報抽出,テキストマイニング

日本語クラウドソーシング翻刻に向けて

永崎 研宣
ながさき きよのり 一般財団法人人文情報学研究所・東京大学大学院情報学環
〒113-0033 東京都文京区本郷5-26-4-11F
Tel. 03-6801-8411        (原稿受領 2014.8.21)
クラウドソーシングによるテクストのデジタル翻刻は近年欧米で流行しつつある。そもそもデジタルテクストには典拠と典拠性の確保という難しさがあるが,国立国会図書館近代デジタルライブラリーのデジタル化資料に対するデジタル翻刻では永続的識別子を前提としてその問題を解決可能である。また,明治大正期の活字字形のデジタル翻刻の難しさという問題もある。それらを踏まえた上で日本語クラウドソーシング翻刻環境を実現すべく「翻デジ2014」が開発・公開された。「翻デジ2014」では,単に本を丸ごと翻刻するというだけでなく,一部でもテクスト入力しておけばGoogle等の検索対象となってそこから近デジ本文画像へとリンクされるため,比較的容易に,近代日本の知をWebに結びつけることが可能となっている。
キーワード:日本語クラウドソーシング翻刻,Unicode,Omeka,近デジ,IVS,典拠性,デジタルテクスト

ゲーミフィケーションとシリアスゲームの相違点について

松本 多恵
まつもとたえ 名古屋大学大学院国際開発研究科助教
〒464-8601 愛知県名古屋市千種区不老町
Tel. 052-789-5111        (原稿受領 2014.3.31)
最近,ゲームの教育利用に関する研究・実践や学習成績の評価など様々な事例が報告されてきている。特にゲーミフィケーションやシリアスゲーム,ソーシャルゲームなども教育に取り入れられてきている。しかし,これらの相違点を明記した論文や書籍は少ない。そこで,本稿では,ゲーミフィケーションとシリアスゲーム,ソーシャルゲームの相違点について解説するとともに,それぞれ教育を進めるうえで考慮すべき長所と短所を整理し,解説する。そして,ゲーミフィケーション,シリアスゲーム,ソーシャルゲームそれぞれを効果的に導入するためのために考慮すべき今後の課題も含めて議論を行う。
キーワード:ゲーミフィケーション,シリアスゲーム,ソーシャルゲーム,ゲーム教育

次号予告

2014.12 特集=「計量書誌学(metrics)を超えて」
(特集名およびタイトルは仮題)

  • 総 論: 計量書誌学(metrics)を超えて
  • 各論1: 計量書誌学の新たな挑戦
  • 各論2: 計量書誌学のビッグデータ的アプローチ
  • 各論3: 計量書誌学的手法による学校図書館の蔵書研究
  • 各論4: データに基づく研究の分析評価とは

など