HOME > 中日新聞掲載の大学記事 > 全て
2015.06.22
崩し字の壁 崩せ 自動解読システム 中京大挑戦
解読が難しい崩し字で書かれた太平洋戦争前の手書きの公文書などを、コンピューターで読み取り、楷書の文書に変換する世界初の自動解読システムの開発に、中京大(名古屋市昭和区)の檜山幸夫教授(日本近代史)や長谷川純一教授(情報工学)らのグループが乗り出す。完成すれば、古い行政文書などの研究を大幅にスピードアップできる。(社会部・今村太郎)
楷書で書かれた現代文の手書きの文字を文書(テキストデータ)に換える技術は既にあるが、崩し字の仮名や漢字が並ぶ戦前の文書は、コンピューターに正しく文字を認識させることが難しく、実用化できる性能を持つシステムは実現していない。
中京大のグループが開発を目指すのは、特に解読が難しいとされる明治時代から戦中までに書かれた文書の解読システム。台湾に保管されている台湾総督府時代の日本政府からの行政文書を解読しながらシステムをつくる。古文書と現代文書の特徴を併せ持つ台湾総督府の文書を読み取れるようになれば、江戸時代から現代まで幅広い文書が解読できるほか、中国語の識別も可能になるという。走り書きのカルテや中国の古文書を解読するなどの活用法も想定している。
長谷川教授ら理系の専門家たちが、読み取った文書から、文字のある場所と余白を識別し、行や文字に分けるプログラムを開発。檜山教授ら文系のグループは、各文字について楷書体ではどう書くかをプログラムのデータベース(DB)に覚え込ませる。コンピューターは読み取った文字をDBで照合して楷書体に置き換えていく。
同じ文字でも書く人の癖などによって字体が大きく異なるため、崩れた字体の複数のパターンを覚え込ませる。年内には台湾総督府の行政文書1万2000冊(各数100枚)の読み取りを始め、数年で全て文書化できるという。
ラテン語の古文書解読システムを開発したことがあるイタリア・ベネチア大と提携し、解読技術について情報交換を進める。中京大を運営する梅村学園の梅村清英理事長が5月にベネチアを訪れ、協定を締結した。
梅村理事長は「古い行政文書から、新たな事実が出てくる可能性もある」と期待を込める。
(2015年6月22日 中日新聞朝刊27面より)
楷書で書かれた現代文の手書きの文字を文書(テキストデータ)に換える技術は既にあるが、崩し字の仮名や漢字が並ぶ戦前の文書は、コンピューターに正しく文字を認識させることが難しく、実用化できる性能を持つシステムは実現していない。
中京大のグループが開発を目指すのは、特に解読が難しいとされる明治時代から戦中までに書かれた文書の解読システム。台湾に保管されている台湾総督府時代の日本政府からの行政文書を解読しながらシステムをつくる。古文書と現代文書の特徴を併せ持つ台湾総督府の文書を読み取れるようになれば、江戸時代から現代まで幅広い文書が解読できるほか、中国語の識別も可能になるという。走り書きのカルテや中国の古文書を解読するなどの活用法も想定している。
長谷川教授ら理系の専門家たちが、読み取った文書から、文字のある場所と余白を識別し、行や文字に分けるプログラムを開発。檜山教授ら文系のグループは、各文字について楷書体ではどう書くかをプログラムのデータベース(DB)に覚え込ませる。コンピューターは読み取った文字をDBで照合して楷書体に置き換えていく。
同じ文字でも書く人の癖などによって字体が大きく異なるため、崩れた字体の複数のパターンを覚え込ませる。年内には台湾総督府の行政文書1万2000冊(各数100枚)の読み取りを始め、数年で全て文書化できるという。
ラテン語の古文書解読システムを開発したことがあるイタリア・ベネチア大と提携し、解読技術について情報交換を進める。中京大を運営する梅村学園の梅村清英理事長が5月にベネチアを訪れ、協定を締結した。
梅村理事長は「古い行政文書から、新たな事実が出てくる可能性もある」と期待を込める。
(2015年6月22日 中日新聞朝刊27面より)