アノテーションツールとは
アノテーションツールとは、機械学習に必要な教師データの作成作業を、自動化・効率化するツールのことです。機械学習はAIの精度を高めるために用いられるため、AIアノテーションツールとも呼ばれます。
アノテーションとは
アノテーションとは、機械学習に使用する画像・動画・テキストなどのさまざまな学習データをラベル付けして、教師データを作成することです。例えば、AIにリンゴを認識させるためには、リンゴのタグを付けた教師データを取り込み、機械学習を繰り返します。機械学習に必要なのが、数百・数万もの教師データです。
教師データの量や質がAIの精度向上に直結するため、大量のデータをルールどおりにラベル付けしなければなりません。手作業でアノテーションするには、膨大な時間と人手を要します。
そこで有効なのが、ラベル付け作業を自動化・効率化できるアノテーションツールです。さらに、代行サービスへアノテーション作業を依頼する手もあります。アノテーションツールの活用には運用ルールの策定が必要のため、専門知識を持つ人材や人的リソースが乏しい場合などは、代行サービスの利用を検討してみるとよいでしょう。
アノテーションツールの主な機能
アノテーションツールには、主に以下の機能が搭載されています。
- ■自動アノテーション
- 独自のAI技術を用いて、画像データのなかの対象物を自動で検出し、抽出からラベル付けまでを自動化します。自動アノテーション後のデータは、手作業で確認・修正ができます。
- ■対象の抽出・ラベル付け
- 画像データのなかから対象物を選択してラベル付けしたり、音声データをテキストに書き起こして特定の単語にタグ付けを行ったりします。
- ■進捗管理機能
- アノテーションされたデータや作業の状況を、リアルタイムで確認できます。AIサービス開発のスケジュール管理としても役立ちます。
- ■データの出力
- CSV・YOLO・COCO・Pascal VOCなど、複数の形式でデータ出力ができます。自社のAIモデルと同じ形式でアノテーションデータを出力する必要があるため、多くのツールが複数の出力形式に対応しています。
アノテーションについてより詳しく知りたい方は、以下の記事をご覧ください。
アノテーションツール・サービスの選び方
対象データや特徴の異なるアノテーションツール・サービスを、どのような基準で選んだらよいのでしょうか。3つのポイントを解説します。
- ・アノテーションの目的にあっているか
- ・利用予定の出力フォーマットに対応しているか
- ・操作性に優れているか
アノテーションの目的にあっているか
アノテーションの目的は、AIの教師データを作成することです。自社でどのようなAIモデルを構築するかにあわせて、どのような教師データを与えるか検討が必要です。アノテーションツールは製品により、画像認識・動画認識・自然言語処理のいずれかに強みがあります。下記を踏まえ、目的に応じて選択しましょう。
- ■画像認識・動画認識
- 四角形(バウンディングボックス)や多角形(ポリゴン)で囲い込んだり、塗り絵のように色付け(セグメンテーション)したりして、ラベル付けします。人体の骨格にあわせて関節にポイントを追加して、ラベル付けするものもあります。
- ■自然言語処理
- 自然言語処理では、固有名詞・日付・時刻、特定の文字や文章全体にラベル付けします。
利用予定の出力フォーマットに対応しているか
アノテーションツールによって、出力フォーマットはバラバラです。出力フォーマットはAIフレームワークに対応しており、AIフレームワークはDarknet・TensorFlow・CNTKなど多数存在します。AIフレームワークには、AI作成に必要な機能がすべて実装されています。
AIのアーキテクチャが実装され、学習を行えるソフトウェアです。自社で利用するAIフレームワークに対応しているかを確認し、アノテーションツール・サービスを選択してください。なかには、ツールを使用することで複数の出力形式に対応できるものもあるため、あわせてチェックするとよいでしょう。
操作性に優れているか
アノテーションツールが自動処理した後、複数の作業員が膨大な作業を同時に進めます。管理者は、どの作業員にどのファイルのどこを担当させるかを決め、個別に送る煩雑な作業をしなければなりません。
機能が優れたアノテーションツールには、タスクのアサインや進捗状況が一目でわかるものがあります。煩雑な作業のサポートに有効でしょう。作業員がマニュアルなしで直感的に操作できたり、分からなければすぐ調べられたりするものもあります。操作性に優れたアノテーションツール・サービスを選択してください。
アノテーションサービスの活用もあり!おすすめの会社を比較
前述したとおり、アノテーション作業には膨大な時間と人手を要します。ツールの活用には専門知識をもつ担当者が必要であることから、代行サービスへアノテーションを依頼する企業も少なくありません。そこで最初に、アノテーションの代行サービスを提供している会社を比較して紹介します。各サービスの特徴を詳しく見てみましょう。
《TASUKIアノテーション》のPOINT
- データ収集・加工を代行するアノテーションサクセスサービス
- 品質・スピード・コストに優位性を持ち、AIの精度向上に寄与
- 煩わしさを排除したAIエンジニアのためのSaaSプラットフォーム
ソフトバンク株式会社が提供する「TASUKIアノテーション」は、AI自動アノテーションと専門人材により、高品質でコストを抑えたアノテーションが可能です。自社のAIモデル開発経験から生まれた独自テクノロジーを用いて、アノテーションを代行します。作業マニュアルの自動作成機能や、顧客と作業者の認識齟齬を早期解決するチャット機能によって、アノテーションの依頼・確認業務をスピーディーに実施できます。
参考価格 |
1ラベル単位7円~ |
提供形態 |
サービス / SaaS |
対象データ |
画像 / 動画 / 音声 / テキスト |
サポート体制 |
専任のサクセスチームが支援 |
※"ー"の情報はITトレンド編集部で確認できなかった項目です。詳細は各企業にお問い合わせください。
製品・サービスのPOINT
- 7年以上の豊富な経験と国内シェアNo1実績(※)
- アノテーション済み走行画像データセットの販売
- 完全自社グループ内での対応によるセキュリティ対策の徹底
株式会社ブライセンが提供する「アノテーションマネジメントサービス」は、画像アノケーションに特化したサービスです。そのほか、AIモデルの構築や作業の進め方など、顧客のリクエストにあわせアノテーションに関する提案も行います。トリプルチェックで高い品質を保ち、ベトナム・ミャンマー・カンボジアの大規模BPOセンターで、大量のアノテーション作業やデータ管理・整理にも迅速に対応します。
参考価格 |
ー |
提供形態 |
SaaS / サービス |
対象データ |
画像 |
サポート体制 |
アノテーションに関する要望や課題にオーダーメイドの解決策を提案 |
※"ー"の情報はITトレンド編集部で確認できなかった項目です。詳細は各企業にお問い合わせください。
製品・サービスのPOINT
- 【高品質】品質で選ぶなら信頼の矢崎
- 【価格】矢崎のアセットを活用しリーズナブルな価格を実現
- 【対応力】複雑で難易度の高い案件こそ 矢崎の”社員”が活きる
矢崎総業株式会社が提供する「YAZAKIの画像アノテーションサービス」は、自動車業界で培った品質管理のノウハウやセキュリティ環境を活かして、高品質な教師データの作成を代行します。アノテーションしたデータは全数検査とトリプル検査を実施。画像1枚から依頼可能で、要件定義が難しい案件にも柔軟に対応してくれます。国際規格ISO27001をベースとしたセキュリティ基盤を採用しているため、セキュリティ面も安心でしょう。
参考価格 |
ー |
提供形態 |
サービス |
対象データ |
画像 |
サポート体制 |
ー |
※"ー"の情報はITトレンド編集部で確認できなかった項目です。詳細は各企業にお問い合わせください。
製品・サービスのPOINT
- 教師データの品質を100%完全保証
- 情報漏洩等の心配がない万全のセキュリティ体制
- AIシステムの開発を総合的にサポート
株式会社Nextremerが提供する「Nextremer アノテーションサービス」は、画像・動画・音声・テキスト・合成など、幅広いデータ形式のアノテーションに対応しています。要件定義から教師データ作成まで、一貫した代行が可能です。さらに、専任アノテーターや機械学習エンジニアなど、AIシステム開発に精通する専門家が在籍しているので、周辺システム開発や保守運用まで総合的なサポートも依頼できます。
参考価格 |
ー |
提供形態 |
サービス |
対象データ |
画像 / 動画 / 音声 / テキスト / 合成など |
サポート体制 |
平日は電話・メール・Web会議などで対応可能 |
※"ー"の情報はITトレンド編集部で確認できなかった項目です。詳細は各企業にお問い合わせください。
海外発のアノテーションツールを比較
ここからは、おすすめのアノテーションツールを比較して紹介します。まずは、海外発のツールを見てみましょう。
VoTT
マイクロソフトが提供。MITで開発されたオープンソースで、画像および動画用アノテーションツールです。OSはWidows、Mac、Linuxに対応。データセットはCNTK、PascalVOC、YOLO形式で出力できます。マウス操作で容易にアノテーション可能です。ローカルまたはクラウドストレージプロバイダーへのデータのインポート機能や、ラベル付きデータをエクスポートする機能を搭載しています。
※すでにメンテナンスが終了している可能性があります。
Labelbox
Labelboxが提供。一定の利用量まで無料で使える画像アノテーションツールです。画像の画素にタグ付けを行うバウンディングボックスや、関節点で人間を検出するポイント機能があります。そのほか、PascalVOC・COCO形式への変換も可能です。複数のラベリング作業員に直接確認および調整できるため、プロジェクト全体の管理が容易です。自動ラベリングを行い、手動ラベリングを効率的に行えます。
labelImg
GitHub, Inc.が提供。無料で公開されている画像アノテーションツールです。Linux、macOS、Windowsに対応。データセットはPascalVOC、YOLO、CreateML形式をサポートしています。物体検出のためのバウンディングボックス機能があります。一度出力したxmlファイルの自動再読み込みも可能です。別の物体検出システムの出力結果をPascal VOCフォーマットで保存すれば、画像のアノテーション処理を半自動化できます。
labelme
GitHub, Inc.が提供。MITで開発されたWindows・macOS・Ubuntu対応の画像アノテーションツールです。Webブラウザ上で使用でき、GUIのためマウスでの簡単操作が可能です。画像認識・物体検出・セマンティックセグメンテーション・インスタンスセグメンテーションなどの機能が搭載されています。またラベル・フラグ、自動保存、ラベル検証などのGUIのカスタマイズや、VOC形式とCOCO形式のデータセットへのエクスポート機能もあります。
Annotorious
GitHub, Inc.が提供。MITで開発されたオープンソースで、Webベースの画像アノテーションツールです。JavaScriptを数行書くだけで、画像に描画・コメント・ラベル付けが可能です。独自のアノテーションツールを構築するための、JavaScript APIを備えています。カスタマイズ性に優れ、CSSでルック&フィールを変更したり、独自のプラグインやエディタ拡張機能を構築したりできます。
COCO Annotator
GitHub, Inc.が提供。MITで開発されたオープンソースで、Webベースの画像アノテーションツールです。オブジェクトのセグメンテーションやキーポイント、バウンディングボックスなどのアノテーションに対応しています。セグメントへ任意の数のラベル付けや、カスタマイズされたメタデータの付与も可能です。COCO形式に、エクスポートおよびインポートできます。
VGG Image Annotator (VIA)
オックスフォード大学が提供。画像、音声、映像に使用できる手動のアノテーションツールです。HTML、Javascript、CSSだけで開発されたオープンソースです。Webブラウザで実行され、インストールやセットアップの必要がありません。物体検出が可能で、複雑なバウンディングボックスを作成できる特徴があります。独自形式のJSON、あるいはCSV形式に出力できます。
国産のアノテーションツールを比較
続いて、国産のアノテーションツールを比較して紹介します。
FastLabel
FastLabel株式会社が提供。日本語に対応したアノテーションツールです。画像や動画、テキスト、音声などのアノテーションがWeb上から可能です。端末へのインストールは必要ありません。データセットは、YOLO・COCO・PascalVOC・VoTT・labelme形式に対応しています。無料プランが用意されており、5ユーザー・データ数1,000件・データサイズ500MBまでは無料で利用できるので、小規模なプロジェクトチームにおすすめです。
AnnoStation
株式会社Orniが提供。初めての人でも使いやすい、WebベースのAIを用いた画像認識専用アノテーションツールです。アノテーションプロジェクト管理を1か所で行うことで、チーム作業が効率化し、高品質なアノテーションデータ作成ができます。迅速なフィードバックにより、一貫したアノテーションが可能です。進捗状況をリアルタイムに把握でき、プロジェクト管理が容易です。
annofab
有限会社来栖川電算が提供。アカウント登録すれば無料で使用できる画像や時系列データ用のアノテーションツールです。時系列データとは、動画データのように時間で区切られるデータなどを指します。対応するブラウザは、PC版のGoogle ChromeとMozilla Firefox。入力データのファイル形式は、jpeg・jpg・png・gifです。ラベリング作業員の作業時間や修正回数など、ダッシュボードからいつでも確認できます。
harBest
株式会社APTOが提供。画像・動画・音声用のアノテーションツールです。企業に代わり、データの収集・作成を全国のクラウドワーカーが行います。作成されたデータ品質を自動評価して、質のよいデータのみをフィルタリングで抽出可能です。アノテーション作業の進捗を管理できる機能もあります。氏名・メールアドレスを登録すれば、フリープランを利用できます。
AI Annotation Platform
株式会社コネクティルが提供。国内のサーバを利用し自社開発した画像アノテーションツールです。小規模のプロジェクト用に、無料プランが用意されています。ウンディングボックス・ポイント・ポリゴン・ラインなどの機能が搭載されています。また、画像上に吹き出しのコメントを入れた質疑応答機能、ファイルやデータの確認機能、作業の割り振り機能などによって、作業の管理もスムーズに行えるでしょう。
アノテーションツールを比較して、AI開発を前進させよう
AIの精度向上には、アノテーション作業が欠かせません。しかし、数百・数千ものデータを手作業でアノテーションするのでは、膨大な時間と人手が必要です。自社のAI開発を成功させるためにも、アノテーション作業を自動化・効率化させ、より創造的な業務に注力することが大事でしょう。そこで有効なのが、アノテーションツールや代行サービスの活用です。以下の3つのポイントに留意して選定しましょう。
- ・アノテーションの目的にあっているか
- ・利用予定の出力フォーマットに対応しているか
- ・操作性に優れているか
自社に最適なアノテーションツール・代行サービスを導入し、AI開発をより前進させましょう。