【No.B005】画像データを読み込んで研修受講のサポートをしてもらう

はじめに

対象者:研修で行われるワーク等で楽をしたいAIのサポートが欲しい人
ゴール:
AIスキルを駆使することで研修を効率化できること
制約条件:オンライン

研修でのグループワーク、正直いうと苦手なんです…

なかなか自分の意見に自信が持てなくて…

研修は自分で考えることが大事ですよ。でも有意義な研修を受けるために

AIを利用するのは良いことだと思うので、ここで簡単に紹介していきます。

★関連リンク
業務で活用できるAI技集のまとめはこちら
会議時に自動で議事録をとりたい方はこちら
社内資料をAIを使って検索・要約したい方はこちら
資料用の簡単な図をChatGPTに書かせたい方はこちら
資料用の簡単な絵をChatGPTに書かせたい方はこちら

手順 難易度:★☆☆☆☆

①教材をテキスト化

【※教材がpdfやpptxなどデータ化されていれば②へ】
通常、会社で研修を実施する場合は事前にテキストが配布されることが多いが、教材が紙ベースだったりするとワークの課題内容をデバイス上でコピぺできないので、キーボードで直打ちする必要がある。もし入力が面倒な場合については以下のサイトを参考にしてPythonで画像をテキスト化することをお勧めする。(写真を撮る→画像ファイルをPCに送信→下記のサイトでテキスト化)
【No.L015】Pythonで画像からテキストにする技術(OCR)の手順と方法 | Google Colabでの実行 – GIS Academy

②Chat-GPTで発案

ワークの課題がテキストで抽出できたら、内容をコピペしてChat-GPTに回答例を考えてもらう。たとえば課題が、

「ある製造業の会社で、生産性が低下していることが問題となっています。社内のプロセスを見直し、生産性を向上させるための具体的な施策を提案する必要があります。」

だった場合、プロンプト例は以下のようになる。

以下の課題について、解決案を箇条書きで簡単にまとめよ。
-----------
ある製造業の会社で、生産性が低下していることが問題となっています。社内のプロセスを見直し、生産性を向上させるための具体的な施策を提案する必要があります。

たったこれだけで研修のサポートができるので積極的に実践して頂きたい。

[参考] 他業務への応用
今回は研修のワークという限定的な利用方法で紹介したが、実用例は他にも存在する。例えばe-learningなどの教育コンテンツにも当手法は実践可能だが、答えを見るだけのチート用として使うと
スキルが身につかないので要注意。

有料&モバイル活用 難易度:★☆☆☆☆

①Chat-GPT 4oを活用

2024.5.14にOpenAIが発表したGPT-4oを使うともっと便利なので紹介。Chat-GPT 4oの特徴として画像認識の性能がGPT-4に比べて上がっているのでこの特徴を利用する。

まずは事前にPCもしくはモバイルでChat-GPTにアクセスし、モデル:Chat-GPT 4oを選択(※現時点では無料ユーザもGPT-4o利用可能)。その後、スクリーンショットや写真でワークの課題部分を画像ファイル化する。最後にGPT-4oに画像ファイルを添付して、以下のプロンプトを実行すれば終了。

添付画像ファイルの課題について、解決案を箇条書きで簡単にまとめよ。
[参考] ChatGPT Plusプラン
無料プランはGPT-4oに10回/3時間しかアクセスできないが、有料版(ChatGPT Plus:$20.00/月)は2024.5.19時点で40回/3時間利用可能。ちなみに精度は劣るものの画像認識が可能なGPT-4も有料プランは使えるので、たくさん試したい方は有料プランへの登録をお勧めする。
[参考] 画像認識の精度(GPT-4 vs GPT-4o)
結論として想定通りGPT-4oのほうが良い結果となった。ただしGPT-4も数か所の誤字・脱字があ
程度だったので実践活用としては十分。※出力した文章に誤字・脱字・文法間違いを校正させればOK

プロンプト:画像の文章をそのまま文字起こしして下さい。

①ももたろうのテキスト
【結果】GPT-4:○ GPT-4o:○



②東京新聞HPのスクリーンショット
【結果】GPT-4:△ GPT-4o:○



③当HPのトップを写真撮影
【結果】GPT-4:△ GPT-4o:○

コメント