作曲のサポート、動画・音楽配信、 録音データの文字起こし。1台3役のミキサー『AG03-MIKU』

今月自らを捧げたガジェット

YAMAHA
AG03-MIKU
実勢価格:1万6200円

YouTuberやPodcasterからの支持が厚いコンパクト3チャンネルミキサーの初音ミクコラボモデル。通常版と比較して付属ソフトが多い。とはいえ初音ミクの体験版やフリー音楽素材が不要なら、1万2800円で購入できる通常版がオススメ。USB DAC(124bit/192kHz)としても使えるし、出力端子も豊富でスピーカー派も納得。

作曲のサポートによし 動画・音楽配信によし 録音素材からの文字起こしによし

ライターという立場柄、よく取材時の録音データからの文字起こし作業に悩まされます。飽きるんですよね、ぶっちゃけ。集中力が続かないときはFacebookとか見ちゃって“いいね!”をポチり。またはLCCのセール情報みちゃって格安便をポチり。仕事人として、よくありません。

そんなわけでいままで、録音した音声の自動テキスト化ツールにはかなり投資してきました。でもあまりアタマがよろしくないというか、あの手の言語エンジンは特定の人のベシャリを覚え込ませないとまともにテキスト化してくれないものばかり。何十時間もかけて育てないとならないし、そもそも多人数の声が入り交じる取材時の録音データの文字起こしには適しません。

ところが近年、ディープラーニングの進化により、自然言語技術も高まってきました。アップルのSiriやGoogleアシスタントがその代表例です。

誰がしゃべってもかなりの高精度でテキスト化してくれるようになりました。そこで流行りつつあるのがGoogleドキュメントを使った音声入力。スマホをマイク代わりに使い、認識ミス部分はPCの画面で修正するというテクが流行りつつあります。試してみたところ、なかなか悪くない。でもスマホを持つ手が疲れちゃうなあ、と。

何か他の方法はないかと思って見渡したところ、見つけたのがこの『AG03-MIKU』でした。昨年、ブロガーの友人に勧められて購入したものの放置していたんですよ。PCで録音するようなコンテンツは作らないなーって。

ものは試しです。ブラウザソフトのChromeでGoogleドキュメントにアクセス。Windows用フリーウェアの「テープ起こしプレーヤー」(アスカ21製)で録音データを再生し、ヘッドホンから聴こえてきた言葉をそのまま、『AG03-MIKU』に接続したコンデンサマイクに向けて喋ってみると……。

お、おお。めっちゃ精度、高い! 滑舌が悪いところや専門用語などは認識ミスが連発しますが、いやいやそんなの至極当たり前のこと。前者は自分のスキル不足だし、後者は文字起こし業者に依頼しても起こりうるのだから。

良質なマイクの実力を引き出せる高音質性能

USBでPCなどと接続できるミキサーとしてはエントリー級。しかし入力時の音質が高く、ニュアンスの差や響きの差もストレートに録れる。安価すぎるマイクを使うのはもったいない。楽器の音も録音するなら、ワイドレンジで高感度、精細な音が録音できるコンデンサマイクを使いたい。今回は手持ちの『AT9943』(オーディオテクニカ製)と組み合わせた。

Googleドキュメントの仕様上、ずーっと喋りっぱなし文字変換しっぱなしとはならないのですが、それでも1トークはまるごと入ります。あめんぼの歌でいうと、「あめんぼあかいなあいうえお」から「やまだにひのつくよいのいえ」くらいまではイケますね。

待てよ、『AG03-MIKU』にはループバックの機能もある。再生中の音声をそのままマイクに戻してGoogleドキュメントに認識させたらどうだろう……と試したところ、こっちの正誤率は50%くらい。

でも元の音声データはiPhoneで撮ったものでノイズ過多。もしかしてノイズキャンセリング機能付きICレコーダーで撮った声なら、自動的に、イケるんじゃないだろうか……?

多数の入出力端子を備える
XLR端子(ファンタム電源対応)のほかに、ギターやキーボード、ステレオマイクが使える端子も装備。出力側もオーディオアンプやパワードスピーカー、ヘッドホンと接続できる端子を持つ。エントリーモデルとはいっても、性能は十二分。「歌ってみた」「弾いてみた」にチャレンジしたい人は要チェック。

今回は時間がなくて調査できなかったけど、文字起こし作業的に使えるICレコーダーを発見したら、別途レポートしますね。

それにしても『AG03-MIKU』。意外とヘッドホン出力の音もいい。アンプの駆動力が高く、インピーダンス値の高いヘッドホンもかるがると鳴らします。USB DAC/ヘッドホンアンプとしてもオススメしたくなってきました。

入力モード切り替えが簡単
マイクとギターの音を別トラックとして送れる「DRY CH1-2G」、入力音声を全部まとめる「INPUT MIX」、さらにPC側の音声もミキシングする「LOOPBACK」の設定が、スイッチで切り替えられる。ゲーム実況動画が作りやすいミキサーといわれる所以がここにある。
武者良太(むしゃりょうた)/ガジェットキュレーター。音響機器、スマートフォン、最先端技術など、ガジェット本体だけでなく、市場を構成する周辺領域の取材・記事作成も担当する。元Kotaku Japan編集長。

『デジモノステーション』2018年5月号より抜粋。