観光案内板の文字起こしに機械学習(Google Cloud Vision API)を導入しました。

近頃、あちこちで人工知能に関する記事やニュースを目にする機会が増えてきましたね。「機械学習」はその人工知能を実現する技術のひとつで、Google Cloud Vision APIという画像分析サービスにも組み込まれています。

image

Vision API - 画像コンテンツ分析  |  Google Cloud Platform

Google Cloud Vision APIを使うと、ラベル検出や顔検出、ロゴ検出やランドマーク検出など、様々な情報を画像から引き出すことができます。光学式文字認識(OCR)機能では、画像内に含まれる単語や文章も抽出することも可能です。

今回、この光学式文字認識機能をMonumentoの案内板文字起こしに導入しました!

これまで、案内板画像からの文字起こしは全て人力で行っていましたが、これからは画像投稿と同時に自動でテキスト情報が生成されるようになります。

例えば、この案内板画像を投稿すると・・・

image

光学式文字認識機能によって、以下のテキストが自動で生成されます。

東村指定天然記念物
名 称:サキシマスオウノキ(アオギリ科)
所 在 地:東村字川田下福地
指定年月日:昭和59年3月22日
概要
サキシマスオウノキは、アオギリ科に属し、奄美大島以南の亜熱帯から熱帯に
かけて生えている木で、板のような根(板根)をつくることで有名です。
| ここのサキシマスオウノキは、高さ18m、胸高周囲約2.9mで、地上から
1m余のところから板根を出しています。12本の板根はみごとな流線型をなし、
沖縄本島では最も発達した板根をみせています。
サキシマスオウノキマングローブの後方や河辺などによくみられます。この
地域にも、そばに小さな水流があり、いつも湿っています。ここにサキシマスオウ
ノキが生えていることから、かつてはここも福地川の一部であったと思われます。
県内でも数少ない貴重な木です。みんなで大切にしましょう。
※板根の左に位置する小さな拝所は、川田集落創設の始祖の墓と伝えられて
おり、その始祖は、北山王統の拠城、今帰仁グスクの城主の子孫といわれて
います。(川田村発祥の地となっています。)
東 村教育委員会

正直、驚くような精度です。ここまで自動で抽出されれば、今まで0から入力していた人力による文字起こし作業も今後は校正程度に軽減されます(ので、画像投稿の際には、ぜひテキストの校正にもご協力ください😄)。

案内板の内容や画像の画質によっては、認識率が低かったり校正が大幅に必要となるケースもありますが、このGoogle Cloud Vision APIの性能も時がたつにつれ高まっていくと思います。ちなみに、現時点で認識率が低くなる傾向にあるのは以下のような案内板です。

  • 手書き風文字の案内板
  • 地図や図が含まれる案内板
  • 段組みやレイアウトが複雑な案内板
  • ふりがなが多い案内板
  • 素材に模様がついていたり、汚れのある案内板

ちなみに、画像認識やOCR機能を提供するサービスにはGoogle Cloud Vision API以外にも、Microsoft Azure Computer Vision APIや、Amazon Rekognitionなどのサービスもありますが、今回は対応言語や案内板における認識精度などを検証して、Google Cloud Vision APIを導入しました。

既にMonumentoの多言語翻訳機能に導入済みのCloud Translation API や、アプリの読み上げ機能に導入している音声合成ライブラリと共に、今後も色々なテクノロジーを検証しながら、案内板データベースづくりに活用していきたいと思います!

©Monumento