AIを使って議事録生成アプリを作ってみよう ~後編~

こんにちは~NTです!

立て続けの投稿となりますが、
内容は前編に続きまして後編とさせていただきます。

Bedrockについては、GPT-4oよりも高性能と言われている「Claude 3.5 Sonnet v2」を使用しています。参考記事
ソースコード実行のために色々調べながら動かしたので、今回は実際に動くソースコードも共有します。

あらすじ的には、議事録生成アプリを作ろうという話だったのに、
小説の音声コーパスを文字起こししてAIに内容をまとめてもらおうという趣旨に変わって来ております。。。w

一応、議事録生成用のプロンプトも考えて用意してみたので、
参考にしていただけたらと思います。(個人的に社内で需要があれば作ってみようと思ってます)

今回使用するAWSサービスは以下の通りです。

前回のAWS Batchの処理において、出力結果となる文字起こししたテキスト(約55,000字)をS3にアップロードしてあるので、それを用いてLambdaからBedrockへ投げてみようと思います。

先に当初の目的であった議事録生成用のプロンプトは以下のようになるかなと考えています。

 

今回は、前編でもお伝えしたように実際の会議データは使用していませんので、
夏目漱石の坊ちゃんを題材にプロンプトを考えてみました。

 

なかなか雑ですが、注文の多いプロンプトにしてみました。
そして、ここの[文字起こしテキストを貼り付け]という部分に前編で音声データから文字起こしした約55,000文字の文字列を入れて、Bedrockへ送るコードは以下となります。

AWS Batch上でBedrockを呼び出しても良かったのですが、
Bedrockの実行時間(今回で約30秒程度)分のEC2起動時間を考えると、別実行でLambda上で実行しています。

実際に出力された結果は以下となります。

概要については58文字なので想定通り、まとめについても227文字なので想定通り、
さらには坊ちゃんであると推測までされていました。
最後の「主人公が外国鉄道会社に就職し」という部分は「街鉄の技手」を外鉄と勘違いしていそうです。

業務でもLLM系に触れることは多いですが、やはりこの辺りの技術革新は日進月歩で日々驚かされてます。。。

小説を約3分程度で文字起こしをかけて、30秒程度で全ての内容を把握して要約するというのは、
さすがに離れ業過ぎるのでさすがAIというところもありつつ、
過去に知り得てる情報を使っていたかも知れないので、将来予測などはやはり不完全だと思います。
議事録生成というところでは、また別の時間を使って試してみようと思います。

今回のアドベントカレンダーは全て技術的なお話でしたが、
楽しんでいただけたら幸いです。

最後まで見ていただきありがとうございました!

About the author

Add Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

By NT

最近の投稿

アーカイブ

カテゴリー

タグクラウド

コーポレートサイト