AHREF

AI音声入力アプリ(VoiceKun)

オフライン対応版。入力データが外部に送信されることはありません。

完全ローカル完結でAI音声入力・推敲ができるMac向け無料アプリです。v1.2.0 より MIT ライセンスでオープンソース公開。

VoiceKun

こんな方におすすめ

  • キーボードで長文を打つのがつらい。声で言いたいことがある
  • AIとの壁打ちを音声でリズミカルに行いたい
  • メールやチャットの返信を、音声でさっと済ませたい
  • 音声や入力データはクラウドに送りたくない

音声入力とAI推敲の流れ

推敲後のテキストがここに表示されます

ダウンロード

v1.2.0より、VoiceKun を MIT ライセンスでオープンソース公開しました。

VoiceKun をダウンロード

voicekun.dmg·10.7 MB

対応環境:Apple Silicon(M1 以降)の Mac

バージョン:v1.2.0

更新日: 2026年6月20日

オープンソース

VoiceKun のソースコードは GitHub で公開しています。MIT ライセンスのもと、閲覧・ビルド・改変・再配布が可能です。

上のダウンロードボタンは AHREF が配布する公証済み DMG です。ソースから自分でビルドする場合は、macOS 14 以降・Xcode・XcodeGen が必要です(詳細はリポジトリの README を参照)。

バージョンアップ履歴

VoiceKun の公開バージョンの履歴です。

  1. v1.2.0最新
    • MIT ライセンスでオープンソース公開(GitHub: ahref-org/voicekun)
    • オンデバイス音声認識とローカル LLM による AI 推敲
    • ソースからのビルド手順・配布スクリプトを公開
  2. v1.1.0
    • 音声効果音機能を追加
  3. v1.0.0
    • リリース

インストール手順(かんたん 3 ステップ)

  1. ダウンロードとインストール

    上のダウンロードから DMG を保存し、ダブルクリックで開きます。中にある VoiceKun を「アプリケーション」フォルダへドラッグして配置してください。

  2. アクセス制御の設定

    アプリを起動し、設定の権限タブの案内に従います。マイク・音声認識・アクセシビリティ・入力監視など、macOS の「プライバシーとセキュリティ」で VoiceKun を許可してください。各項目の意味はMac から求められる許可をご覧ください。

  3. AI モデルのダウンロード

    設定 › AI 推敲でモデルを選び「ダウンロード」します。おすすめは Gemma 4Qwen 3.5 4Bです。

使い方

トグル方式(コマンドキーを2回押して入力開始)

  • 入力したいエリアにカーソルを置き、コマンドキー(⌘)を2回押すと、音声入力が開始されます。
  • 画面下部に「入力中」のステータスが表示されます。
  • 音声入力が終わったら、再度コマンドキーを2回押すと確定処理(AI推敲など)に進みます。

利用イメージ

操作

×2

2回押す

音声入力を開始

×2

もう一度2回押す

確定処理へ進む

入力欄

ここに音声入力されたテキストが入ります

ホールド方式(プッシュ・トゥ・トーク)

fn キーとコマンドキー(⌘)を同時に押している間だけ音声入力になります。キーを離すと確定処理に進みます。

利用イメージ

操作

fn
+

fn + ⌘ を同時に押す

離すと確定処理へ進みます。

入力欄

ここに音声入力されたテキストが入ります

VoiceKunでできること

  • 話すだけで文字入力

    AIプロンプト入力、メール、Slack、メモ、ブラウザの入力欄など、カーソルがある場所に音声で入力できます。

  • ショートカットで音声入力

    キーを押して話す/離すと止める、など好みの操作に設定できます。

  • 辞書機能で補正

    固有名詞や社内用語の補正辞書で認識しやすくしたり、決まった言い回しに置き換えたりできます。

  • アプリ内から AI モデルを入手可能

    複数の AI モデルをアプリ内でダウンロードして選べます。おすすめは Gemma 4 と Qwen 3.5 4B です(Apple シリコン搭載 Mac が対象)。詳しくはAIモデルについてをご覧ください。

プライバシーとセキュリティ:100%ローカル駆動

セキュリティを重視する環境でも安心して使えるよう、VoiceKun は外部通信を行わないローカル完結型にこだわっています。

安心のオンデバイス処理

音声認識・AI 推敲・チャットはすべて Mac 内で完結します。クラウドの生成 AI へデータが送られることはありません。

AI モデルもローカル配置

初回ダウンロード後は、ネットワークから独立して動作します。

macOS 設定に関するご注意

アプリ利用のため macOS の「音声入力」をオンにする必要があります。設定画面の「Apple に送信」という表記は、Apple の改善プログラム(任意)に関する説明であり、VoiceKun が音声を送信することはありません。

Mac から求められる許可について

項目詳細
マイク話し声を録音・入力に用いるため、プライバシーでマイクの利用を許可する必要があります。
音声認識オンデバイスで声をテキストに変換するため、音声認識の権限が必要です。
アクセシビリティ他アプリの入力欄へ確定テキストを送るためアクセシビリティ権限が必要です。これにより前面アプリへテキストが挿入できます。
入力監視一部のグローバルホットキーがキーイベントの監視を要します。ホットキーの種類により必要になります。
キーボード音声入力(Dictation)VoiceKun の音声認識は Apple の Speech フレームワークの SFSpeechRecognizerを用い、requiresOnDeviceRecognitionによるオンデバイス認識を利用します。

一度「許可しない」を選ぶと、アプリの画面だけでは直せません。システム設定の「プライバシーとセキュリティ」から、該当する項目を開き直してください。

すでにホットキーが登録されているアプリがある場合は、キー割り当てが競合している場合があります。アクセシビリティや入力監視に該当しそうなソフトがないか確認してください。

バージョンアップの際は、古いバージョンが権限一覧に表示されている場合があります。その場合はON,OFFではなく、一度削除してから、新しいバージョンを登録しなおしてください。

AIモデルについて

VoiceKun は、以下の AI モデルから選択できます。モデル取得は Hugging Face から行われます。

おすすめは Gemma 4Qwen 3.5 4Bです。

モデル生成元特徴DLサイズ
Gemma 4 E2B IT Q4_K_Mおすすめ
Google約20億パラメータの超軽量モデル。128Kの長コンテキスト対応で、低遅延・省メモリ運用に最適(※VoiceKunではテキスト機能のみ利用)。約 3.2 GB
Qwen3.5 4B Instruct Q4_K_Mおすすめ
Alibaba40億パラメータの密(dense)モデル。201言語対応・長コンテキストで、小型ながら高い指示追従性能と言語能力を誇る。約 2.5 GB
Phi-3 Mini 4k Instruct Q4
Microsoft約38億パラメータの軽量モデル。4Kコンテキストと小規模ながら、高い推論・指示追従性能を持つ(省メモリ向け)。約 2.1 GB
Mistral 7B Instruct v0.3 Q4_K_M
Mistral AI70億パラメータの汎用モデル。32Kコンテキストに対応し、自然な会話や的確な指示追従に定評がある。約 4.1 GB
Llama 3 8B Japanese Instruct Q4_K_M
MetaMeta Llama 3 8B Instructをベースに、日本語会話データで追加調整した派生モデル。日本語の表現力や推敲品質を最重視する場合に最適。約 4.6 GB

設定 › AI 推敲 でモデルを選び「ダウンロード」してください。

Hugging Faceは、世界中の開発者が最新のAIモデルを公開・配布している、世界最大のAIライブラリです。

特徴欄は Google(Gemma 4)、Alibaba(Qwen3.5)、Microsoft(Phi-3)、Mistral AI、Meta(Llama 3)の公開ドキュメント・モデルカードに基づく要約です。VoiceKun で配布するのはいずれも Q4 系 GGUF です。

よくあるご質問

© 2000-2026 ahref.org. For all web creators.