案内板の文字起こしについて

image

先日、OCRによる画像からのテキスト抽出機能を追加したので、改めて案内板のテキスト化についてその手順を以下のページにまとめました。

案内板の文字起こしについて - Monumento

また、テキスト化画面に「OCRでテキストを抽出する」ボタンも追加しましたので、過去に投稿された案内板など、まだテキストが未入力の案内板でお試しください。

image

ご意見やお問合わせはお気軽にどうぞ!

観光案内板の文字起こしに機械学習(Google Cloud Vision API)を導入しました。

近頃、あちこちで人工知能に関する記事やニュースを目にする機会が増えてきましたね。「機械学習」はその人工知能を実現する技術のひとつで、Google Cloud Vision APIという画像分析サービスにも組み込まれています。

image

Vision API - 画像コンテンツ分析  |  Google Cloud Platform

Google Cloud Vision APIを使うと、ラベル検出や顔検出、ロゴ検出やランドマーク検出など、様々な情報を画像から引き出すことができます。光学式文字認識(OCR)機能では、画像内に含まれる単語や文章も抽出することも可能です。

今回、この光学式文字認識機能をMonumentoの案内板文字起こしに導入しました!

これまで、案内板画像からの文字起こしは全て人力で行っていましたが、これからは画像投稿と同時に自動でテキスト情報が生成されるようになります。

例えば、この案内板画像を投稿すると・・・

image

光学式文字認識機能によって、以下のテキストが自動で生成されます。

東村指定天然記念物
名 称:サキシマスオウノキ(アオギリ科)
所 在 地:東村字川田下福地
指定年月日:昭和59年3月22日
概要
サキシマスオウノキは、アオギリ科に属し、奄美大島以南の亜熱帯から熱帯に
かけて生えている木で、板のような根(板根)をつくることで有名です。
| ここのサキシマスオウノキは、高さ18m、胸高周囲約2.9mで、地上から
1m余のところから板根を出しています。12本の板根はみごとな流線型をなし、
沖縄本島では最も発達した板根をみせています。
サキシマスオウノキマングローブの後方や河辺などによくみられます。この
地域にも、そばに小さな水流があり、いつも湿っています。ここにサキシマスオウ
ノキが生えていることから、かつてはここも福地川の一部であったと思われます。
県内でも数少ない貴重な木です。みんなで大切にしましょう。
※板根の左に位置する小さな拝所は、川田集落創設の始祖の墓と伝えられて
おり、その始祖は、北山王統の拠城、今帰仁グスクの城主の子孫といわれて
います。(川田村発祥の地となっています。)
東 村教育委員会

正直、驚くような精度です。ここまで自動で抽出されれば、今まで0から入力していた人力による文字起こし作業も今後は校正程度に軽減されます(ので、画像投稿の際には、ぜひテキストの校正にもご協力ください😄)。

案内板の内容や画像の画質によっては、認識率が低かったり校正が大幅に必要となるケースもありますが、このGoogle Cloud Vision APIの性能も時がたつにつれ高まっていくと思います。ちなみに、現時点で認識率が低くなる傾向にあるのは以下のような案内板です。

  • 手書き風文字の案内板
  • 地図や図が含まれる案内板
  • 段組みやレイアウトが複雑な案内板
  • ふりがなが多い案内板
  • 素材に模様がついていたり、汚れのある案内板

ちなみに、画像認識やOCR機能を提供するサービスにはGoogle Cloud Vision API以外にも、Microsoft Azure Computer Vision APIや、Amazon Rekognitionなどのサービスもありますが、今回は対応言語や案内板における認識精度などを検証して、Google Cloud Vision APIを導入しました。

既にMonumentoの多言語翻訳機能に導入済みのCloud Translation API や、アプリの読み上げ機能に導入している音声合成ライブラリと共に、今後も色々なテクノロジーを検証しながら、案内板データベースづくりに活用していきたいと思います!

案内板が10,000枚を突破しました!

記念すべきお知らせです!

みんなでつくる案内板データベースMonumento、

案内板登録件数が1万枚を突破しました!

サービスのリリースから早3年、観光地や史跡、街道や坂好きな皆さんからは絶え間なく毎日のように案内板を投稿していただきました。

image

この1万枚はまさに参加者の皆さんの足跡

本当にありがとうございます。

そして、記念すべき1万枚目の案内板はこちら!


image

kawa_sanpoさんの投稿、勅願殿 - Monumento(モニュメント)   でした!


それから、皆さんから投稿いただいた案内板のテキスト化は今でも人力で行っていて、現時点でのテキスト化率は約60%です。

近頃は画像認識などの技術や精度も大幅に向上しているので、材質や文字の形、縦書きの日本語などへの対応状況と実用度を検証しながら導入の検討を続けます。


image


というわけで、これからも

みんなでつくる日本一の案内板データベース Monumento 

を、皆さんの街歩きのお供としてどうぞよろしくお願いします!


ご意見やお問合わせはお気軽にどうぞ!

新年あけましておめでとうございます!

今年も皆さんと一緒に全国の案内板をざくざくと集めていきたいと思います。

運営チームも、更に楽しく便利なサービスになるよう頑張ります!

今年もどうぞよろしくお願いいたします。

2018年の初投稿はこちらでした! 😄

旧荷坂道 - Monumento(モニュメント) 

image

iPhoneアプリ更新しました!

image

前回のアップデートからだいぶ間が空いてしまいましたが、MonumentoのiPhoneアプリを久々に更新しました!

今回は主にiOS11への対応がその内容です。

特に機能的な追加はないので全く地味な感じですが、アプリを作るためのソースコードをSwift3に置き換えたので、今後は頻度を上げてアップデートできそうです。

というわけで、リクエストや感想など、ぜひお気軽にお聞かせください!

引き続き、「みんなでつくる案内板データベース Monumento」をどうぞよろしくお願いします!

登録案内板が9,000枚を突破しました!

image

10月になりましたね。

沖縄では、この時期あちこちでたくさんのトンボを見かけます。

そんな2017年の秋・・・

Monumentoの登録案内板が9,000枚を突破

しました!!

サービス開始から約3年ちょっとで9,000枚、これも日頃からカメラ片手に街歩きをされている皆さんの足跡の結晶です。

皆さん、案内板共有にご参加いただき、本当にありがとうございます。

ちなみに、記念すべき9,000枚目の案内板はこちらでした!

image

叶神社の社叢林 東叶神社 横須賀市東浦賀2丁目21−25 - Monumento(モニュメント) 


引き続き、皆んなで作る案内板データベース Monumentoを、どうぞよろしくおねがいします。

ご意見やお問合わせはお気軽にどうぞ!

Monumento 案内板情報取得API

皆さんからMonumentoに投稿いただいている、案内板情報を取得するためのAPIを公開しました。

ご利用にはMonumentoへのユーザー登録とAPI KEYが必要となります。

API KEYの取得

  1. Monumentoにユーザー登録し、PCサイトにログインします。
  2. 設定画面の「API KEYを生成する」をクリックすると、API KEYが生成されます。
    ※「API KEYを生成する」ボタンを押す度に新しいキーが発行され、以前のキーは無効となります。

APIの仕様

  • 新着案内板情報
    • 用途:新着の案内板情報を取得します。
    • URL: https://monumen.to/api/v1/spots.json
    • パラメータ
      • apikey={APIKEY}
      • limit={取得件数} *0~500、初期値100
    • 戻り値
      • id:案内板ID
      • lat:緯度
      • lng:経度
      • square_thumb_url:サムネイルURL
      • description_truncated:説明文冒頭部分
  • 周辺案内板情報
    • 用途:位置を指定して周辺の案内板情報を取得します。
    • URL:https://monumen.to/api/v1/spots.json
    • パラメータ
      • apikey={APIKEY}
      • lat={緯度}
      • lng={経度}
      • limit={取得件数} *0~500、初期値100
    • 戻り値
      • id:案内板ID
      • lat:緯度
      • lng:経度
      • format_distance:距離
      • square_thumb_url:サムネイルURL
      • user_thumbnail:ユーザーサムネイルURL
      • spot_username:登録ユーザー名
      • format_created_at:登録日
      • tag_array:タグ
      • text_language:テキスト化済み言語
  • 案内板詳細情報
    • 用途:案内板個々の情報を取得します。
    • URL:https://monumen.to/api/v1/spots/{spot_id}.json
    • パラメータ
      • apikey={APIKEY}
      • spot_id={案内板ID}
    • 戻り値
      • id:案内板ID
      • lat:緯度
      • lng:経度
      • rect_thumb_url:サムネイルURL
      • comment_array:コメント
        • body:コメント本文
        • created_at:投稿日
        • username:投稿ユーザー名
        • photo:画像URL
      • spot_username:登録ユーザー名
      • format_created_at:登録日
      • texts_by:テキスト投稿ユーザー名
      • description:説明文(日本語)
      • description_cn:説明文(中国語簡体字
      • description_en:説明文(英語)

なお、本APIは事前の予告なく仕様の変更を行う可能性があります。

ご質問・ご要望は お問い合わせフォーム からお気軽にお寄せください。

©Monumento