生成AIを学びに使うことができないか、試行錯誤する年末

おはようございます。東京・練馬の税理士、村田龍矢です。

今日は、生成AIを学びに使うことができないか、試行錯誤する年末、というお話。

年末の仕入

年末、色んな物品がセールの対象になっていたこともあって、

骨太のビジネス名著を買ってしまったのです。

1冊で500ページ超。

年末年始でざっと読んでしまっても良かったのですが、せっかくなので生成AIを使って学びを深めることができないか、

材料になってもらうことにしたのです。

書籍を解体してScansnapでPDFにするのはいつものこと。

これでタブレットでもkindle端末でも読書ができる。

今回はその上で、せっかく書籍を自分でPDFにしたのですから、生成AIに放り込んでみてどうなるかを見てみました。

試行錯誤①:容量がデカすぎる

今回使用する生成AIはGeminiとNotebookLMです。

意気揚々とアップロードしてみたものの・・・

さすが500ページ超ある名著。

PDFにするとデータが250MBするというボリューム。

これだけ大きなデータでは、一度にアップロードすることはできません。

(GeminiとNotebookLMはそれぞれにアップロードできるデータの容量に上限あり)

そこで、細かくPDFファイルを分割して、まずはGeminiにアップロードして分析をお願いしてみました。

すると、

「画像データだからうまく拾えないけど~」(意訳)

という回答が。

PDFって、生成AIからすると画像扱いなんですね。

なので、文字をうまく拾えなくて、分析結果もなんだか浅い。しかも、関連情報をネットで拾って補足として使っているようで、いやそれって意味がないじゃないという結果に。

次に、NotebookLMにもデータをアップロードしてGeminiに分析してもらったところ、

やたらと時間がかかる

のです。

しかも場合によっては、Geminiが落ちる。

結果、数分かかってようやく回答が出てくる・・・。これでは話にならん。

やはり、「データ容量の大きさ」をクリアしないと、生成AIといえども十全のパフォーマンスを発揮できないということなのか・・・。

試行錯誤②:PDFにOCRをかける

データ容量は別にいいのですよ。

大元のPDFファイルを細かく分割してアップロードすればいいんですから。

問題は生成AIが「PDFを画像と認識している」と思しき点。

いや、書籍をPDFにしたので、「文字」自体は書いてあるんですよ。

それを生成AIの方で「文字」だと思っていないようなので、そこをクリアしたい。

そこで、OCRにかけることでPDFの中から文字情報を抜き出して、それを生成AIに提供できないかと考えました。

調べてみると、無料でも使えるサービスから、やはり、有料のソフトまで。

とりあえず、無料のサービスをまずは使ってみることにしました。

使ったのはGoogleDrive。

ここにPDFをアップロードして、Googleドキュメントで開くと、

PDFの「文字」だけを拾って文書ができているのです。

なお、図表や絵はもちろんスルーです。

・・・人間が読めるものではない仕上がりなので、読書は難しいでしょうが、

生成AIに提供するならこれで充分。

何より、ドキュメントに変換されたことでデータ容量が激減した結果、GeminiもNotebookLMも動きがサクサク。

書籍の分析結果も、ただのPDFのときよりは充実したものになりました。

ただ、GoogleDriveのOCRは、1つのPDFの容量の上限が100MB?までらしいので、

やはり大きなデータ容量のPDFは細かく分割する必要がありますね・・・。ここがひと手間かかるところ。

・・・というようなことを自分のパソコンで試行錯誤していた年末でございました、はい。

【編集後記】

昨日は午前中はブログ更新と自重トレーニング。

午後からはお客様からいただいたデータの集計。

生成AIを学びに使いやすくするためのプロンプトを試行錯誤。