音声認識で議事録を取るWEBアプリを作った

Pocket

どうも。

クリスマスが終わりましたが皆さんはどのように過ごされたでしょうか。
私はいつも通りの日でしたが、作業しながらずっと薪を燃やしている生放送を見ていました。

そんな中25日に、YuhitsuというWEBアプリを公開しました。
簡単に説明すると音声認識で議事録を取ってくれるというもの。

スマートスピーカーが各社から発売されたりして音声認識技術が注目されているので、「乗るしか無い、このビッグウェーブに!」と思って作りました。

使い方

Chromeじゃないと動きません。

ルームを作る人

  1. Yuhitsuにアクセスする
  2. 右上のSign in with Twitterを押す
  3. Twitterのページに飛ばされるので連携アプリを認証する
  4. 戻ってくるので、左側のCreate a RoomRoom Nameに設定したいルーム名、Room Passwordに設定したいパスワード(省略可)を入力する
  5. Createボタンを押す
  6. 他の参加者にルーム名とパスワードを教える

ルームに参加する人

  1. Yuhitsuにアクセスする
  2. 右上のSign in with Twitterを押す
  3. Twitterのページに飛ばされるので連携アプリを認証する
  4. 戻ってくるので、左側のCreate a RoomRoom Nameに参加したいルーム名、Room Passwordに教えてもらったパスワード(未設定の場合空欄)を入力する
  5. Joinボタンを押す

あとは参加者が喋るだけでログに残ります。

データエクスポート

取った記録を使えないと意味が無いので、

  • Excelで開けるCSV形式(一部文字は消えます)
  • Excelで開くと文字化けするけど文字が消えないUTF-8のCSV形式
  • 全データが入っていて、プログラムで処理しやすいJSON形式

この3つを用意しました。
他に欲しい形式があればTwitterで要望してください。

その他の使い方は触ればなんとなくわかると思います。

不具合等を見つけたり改善点などもTwitterで教えて下さい。

FAQ

Q1

何で動いてるの?

A1

プラットフォームはNode.jsで、音声認識はChromeのSpeechRecognitionを利用しています。

Q2

ソースコードは公開してるの?

A2

GitHubで公開しています。

ライセンスはMITにしていますが、なにか問題があれば非公開にするかも。

Q3

似たようなものが既にあるんじゃない?

A3

ありますが、企業向けのものが大半でオフライン会議での使用をターゲットにしているのに対して、Yuhitsuはコミュニティ等でのオンライン会議での使用をターゲットにしています。

Q4

製作期間は?

A4

他のことも並行してやってたので2ヶ月と少しかかりました。

Q5

音声認識の精度がガバガバすぎる

A5

音声認識のシステムは私が作ったものではなく、GoogleがChromeに搭載したものを利用しているので文句はGoogleに言って下さい。

誤認識を修正したい場合は発言ログの右上にある鉛筆ボタンからできます。

 

以上です。

ぜひ使ってみて下さい。

ではでは。

The following two tabs change content below.
みどりごけ

みどりごけ

スペシャルエグゼクティブアドバイザーほしい物リスト
どこぞのシェル芸大好き鯖管(自称ではない) / 基本情報技術者 / Linux (LPIC2保有) / C# / PHP / JavaScript / 食べ鉄 / Minecraft / ETS2 / GTAV / Ingress
みどりごけ

最新記事 by みどりごけ (全て見る)

1件のコメント

コメントを残す