ユーザ用ツール

サイト用ツール


2025:02:20

文書の過去の版を表示しています。


2/20日記

プログラム

  • ふといろいろ眺めてみたところ、音声認識なんて分野がある。
  • 以前から入力について指がきかなくなった時にどうやって入力すればいいだろうかと考えていた。
  • 入力ソフトだと下記のようなものがある。
  • ただそもそもGoogleの音声認識を使っており、そうなるとオンラインが前提になってしまうのがネックかと思った。
  • 主な用途は文章作成とプログラムなので、せめて口頭でMiniScriptくらいは書けるようにしたい。

  • とりあえず日本語を認識できるか確認した。
  • ただやり方に違いがあって、モデルは別途ダウンロードか解凍しているみたい。これはvoskインストールしたときにモデルも一緒にpipで落としてきたせいかなと思うし、大規模モデルはどうやって使えばいいかは別途確認しておく。
python test_microphone.py --model ja
  • まずは日本語を認識してるのを確認した。すごいな、結構しっかり認識してる。
  • あとは大規模モデルのほうを使いたいと思うのであった。どうしたものか。
2025/02/20.1740046208.txt.gz · 最終更新: 2025/02/20 19:10 by machiaworx