動画眼2をリリースしました!

Pocket

2004年からごく一部の方に愛用いただいているUT動画分析支援ツール動画眼をスクラッチから作り直した「動画眼2」を公開しました。

動作イメージ

もはや自分自身、VB.NETを触りたくないし当時の稚拙なコードをメンテナンスするのも苦痛だったので今回C#でゼロから書き直し、UIなどもモダンなシングルウインドウにしました。また別途開発中(現在クローズドベータ段階)のWatsonを使ったかんたん書き起こしツールのログをインデックスとして使うユースケースを強く意識した作りになっています。公開された暁には是非組み合わせてご活用いただければと思います。

動画眼2は引き続きフリーソフト、オープンソースでの公開です。

詳細はこちら↓。

https://do-gugan.com/tools/do-gagan2/

動画眼Noteも雪が降る前くらいには2にしたいなと。

ClickOnceインストールがブロックされる時の対処法

Pocket

当サイトでもいくつかのツールをClickOnceで配布していますが、Windowsの設定によってはブロックされることがあります。ActiveDirectoryで企業のセキュリティポリシーが適用されている場合もありますが、個人PCでレジストリなどを編集できる場合は以下の手順で回避することができる場合があります。

(レジストリの編集は自己責任でお願い致します。また編集方法の詳細は適宜ググってください。また本来ブロックするべき出所不定(未署名)のアプリケーションを使えるようにするわけですので、ご自身で安全と判断できるアプリケーションにのみ実行してください。)

現象:「セキュリティ設定は、このアプリケーションがこのコンピューターにインストールされることを許可していません。」と表示され先へ進めない。

本来なら警告が出つつも「閉じる」の左に「インストール」ボタンが並び先へ進めるはずですが、それがありません。

Winキー押して「regedit」などと入れ、レジストリエディターを開きます。そして、上部の検索欄に「コンピューター\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\.NETFramework\Security\TrustManager\PromptingLevel」をコピペしていれるか左のツリービューから辿って書きの画面に行きます。

右ペインの上から2番目の「Internet」をダブルクリックし、「値のデータ」欄をDisabledからEnabledに書き換えOKを押します。

これで先の画面に「インストール」ボタンが出現すると思います。ただしツール自体が未署名の場合は依然としてスマートスクリーンの警告(青ダイアログ)が出ます。そちらは「詳細」リンクをクリックすると進めると思います。

ちなみにこの編集は保存操作や再起動なしに適用されます。なので、必要なツールのインストール中にだけ一時的にEnabledにしてOKし、レジストリエディターをそのままにしておいて、インストール終了後にまたすぐDisabledに戻しておくのも良いかも知れません。

新作ツールちら見せ ~UTビデオ分析をクラウドで書き起こしで支援

Pocket

7月に予定していた仕事がことごとく延期になったヒマになったので、以前から取り組もうと思っていたUT支援ツール2本に本格的に着手しました。

一般公開まではもうちょっとテストを重ねてからと思っていますが、だいぶ動くようになっているので動画でチラ見せです。

■UT音声書き起こしツール

以前にもトライアルを記事にしてますが、IBM CloudのSpeech to Text(音声からのAIテキスト起こし)サービスを使ってユーザテストの音声を書き起こすツールです。IBM CloudのAIサービス(いわゆるWatson)は有料サービスですが、ユーザ辞書登録的なことができるので、ユーザテストのような業務文脈の対話では有用です。例えば会話の中に出てくる固有製品名や部位名などをあらかじめ学習しておくことで認識精度を上げることができます。一応簡単なWeb UIは提供されていますが、本ツールの優位点として、

  • 動画から音声を自動抽出してアップロードする(Watsonは音声データしか受け付けない)
  • 複数のファイルを一括処理できる
  • 辞書学習周りもGUIで行える
  • 後述の動画眼で読み込めるタブ区切りテキストファイルで書き出す(標準の出力はJSON形式で扱い辛い)

以下、少し古いバージョンですが動いている様子。

■動画眼2

2004年から公開しているビデオインデックス付けツール「動画眼」を完全フルスクラッチで作り直しています。本ツールは動画の特定タイムコードに対してメモを記入し、そのメモを選択することでタイムコードの位置を頭出し再生するというものです。UTなどの記録と分析、プレゼンにと開発してきました。

現行版はVisual Basic.NET/Windowsフォームで作っておりもはや設計も古い為、メンテナンスがしづらくなっていました。今ならもう少し腕前も上がってるぞということでC#/WPFでゼロから作り直しています。

また分析工程でゼロからインデックスメモを書き込んでいくのも大変で現実の業務でもなかなかやらないだろうということで、先のクラウド書き起こしした全発話インデックスをとりこんで、それをみて当該箇所を探してジャンプする、というユースケースを優先した作りになっています。

こちらも動いている様子を動画に録ってみました。

どちらもそう遠からずリリースできると思うのでご興味のある方はこちらのブログかTwitterアカウントをウォッチしておいていただければと思います。

HCDライブラリ 7巻「人間中心設計における評価」が発売されます!

Pocket

近代科学社よりHCDライブラリシリーズの7巻として「人間中心設計における評価」が2019年4月25日に発売されます。ギリ平成に間に合いました(笑)。

人間中心設計における評価 (HCDライブラリー)

人間中心設計における評価 (HCDライブラリー)

黒須 正明, 樽本 徹也, 奥泉 直子, 古田 一義, 佐藤 純
3,888円(09/19 15:08時点)
発売日: 2019/04/25
Amazonの情報を掲載しています

著者は黒須先生、樽本徹也さん、奥泉直子さん、佐藤純さん、そして私となります。奥泉さんと私は以前マイナビから出させていただいた「マーケティング/商品企画のための ユーザーインタビューの教科書」に引き続き、「なるべくすぐ現場で使えるノウハウ伝授」を念頭に日々現場で使っているテクニックや注意点などを盛れる限り盛ったつもりです。加えて「やっぱ実例がないとイメージしにくいよね」ってことで、今回はなんと有志の方に模擬ユーザテストを行っていただき、その過程と作成した資料(スクリーニングアンケート、進行シート、報告書など)を掲載するというトライアルをしてみました(有志の皆さん、そしてプロダクトをご提供いただいたDMM様、この場を借りてお礼申しあげます)。解説を読んだあとに実際の事例をみて、「あー、実際のUTってこんな感じなのかー」とか「これなら自分達でもできそう!」って感じてもらえるといいなと思います(とはいってもUTに絶対の正解はありませんので、その時々のリサーチゴールにあわせて色々なスタイルにトライしてくださいませ)。

もちろん実践寄りの事例としてだけでなく、樽本さんがあちこちにインタビューしてまとめてくれた内外のユーザビリティ評価の歴史や黒須先生によるさまざまな評価手法の紹介や評価の意義(上司を説得するのに大切ですね!)、そして佐藤さんのアクセシビリティ方面のまとめなど、実践テキスト以外の情報もバランス良く盛り込まれている一冊に仕上がったかと思います(主に他の著者陣の皆さんのおかげで)。是非手に取っていただけたらと思います。

↓こちらは前著になります。

マーケティング/商品企画のための ユーザーインタビューの教科書 (プレミアムブックス版)

マーケティング/商品企画のための ユーザーインタビューの教科書 (プレミアムブックス版)

奥泉 直子, 山崎 真湖人, 三澤 直加, 古田 一義, 伊藤 英明
3,240円(09/19 15:08時点)
発売日: 2016/09/21
Amazonの情報を掲載しています

ユーザテストでの会話をリアルタイムで観察チームに中継する

Pocket



ユーザテストの音声収録機材について、下書きでずっと放置されてた記事を3件公開しました。これらは主に後行程で聞き返す時や書き起こし向けに良い音質で収録をするための考察でした。

しかし現場ではリアルタイムで隣室の見学者に明瞭に聞こえることもまた重要です。今回はそれについて使えそうな機材を紹介、検討してみます。

まずビデオカメラで収録をしている場合。カメラ内蔵マイクで背後から録ることはあまり推奨しないと以前の記事で触れました。ここではなにかしらの外部マイクを使ってカメラまでは綺麗な音が来ているとします。一般的なビデオカメラで録画中に音声を出力で経路は、

  • HDMI端子
  • ヘッドホン端子

でしょうHDMIの場合、画像と一緒に1本のケーブルで伝送できますので、観察側にHDMI入力のついたモニタを設置すれば万事解決です。ただし機種によって録画中はHDMI出力されなかったり、各種インフォメーションが消せなかったりするものもあるので注意が必要です。

ヘッドフォン端子はもちろん音声だけです。例えばインタビュー中心の実査で、マジックミラー付きルームで音だけ明瞭に中継できれば良い、という時なんかはこちらを使う手もあります。ビデオカメラではなくICレコーダーをマイクに使っても良いでしょう。

その場合、普通のミニプラグのついた音声ケーブルで引き回しても良いのですが、一般にヘッドフォン端子からの出力はレベルが低く、そのままヘッドフォンで一人が聴く分には良くても、複数人向けにスピーカーから出そうとすると別途アンプで増幅する必要が出てきます。

そんなケースで個人的にオススメなのが、TV用の手元スピーカーと言われるジャンルの商品です。

要は耳が遠くなったシニアや、夜間に家族に迷惑をかけずにひっそりテレビを視聴したい、でもヘッドフォンや嫌ずら、、という人向けの製品で、伝送方式は有線、無線(電波、赤外線)と色々ありますが、ここでは電波式のものをオススメしたいと思います。送信機を(電源と)ビデオカメラのヘッドフォン端子に接続し、スピーカー本体を観察室に持ち込めば、隣室でしたら配線不要で音を綺麗に中継することができます。製品の性質上、Bluetoothなどと違い遅延を減らすことにこだわって設計されています。σ(^^)はSONYのSRS-LSR100を購入しましたがとても聞きやすく重宝しています。また人の声をより際立たせるモードがついているのもこういう用途に向いていると思います(購入時のレビューはこちら)。普通にアンプ付きスピーカーとしても使えるので、たとえばHDMIで伝送した先がプロジェクターなのでスピーカーがショボくて聞こえない、という時なんかにも使えます。

ちょっちお値段高いなという時は余計な機能を省いた有線商品も。今年も産業技術大学院大学のユーザテスト演習で7チームの環境を同時構築する際にもこうした機材を用意したいなと思いつつも、さすがにSRS-LSR100を7台は買えません。そこで買ってみたのがこちら。

なんとまぁ900円。電源は単三x4本、ケーブルは5mです。動作時間は(音量にもよるでしょうが)約70時間のようです。背面に好きな写真をセットできるという謎の機能までついていますw。5mのケーブルは直付けですが、本体下部に収納ボックスが内蔵されているので、使わない時は割とスッキリ置いておけそうです。人の声だけを際立たせるとか凝った機能はついていませんが、とりあえずビデオカメラにヘッドフォン端子に直結でちゃんと音が出ることは確認しました。同演習は同室内でついたて越しに観察するので5mという距離はまぁギリ足りるかなという感じです(むしろハウリングが心配)。実務で別室までひく場合は延長が必要になるでしょう。でもまぁこれくらいのお値段ならポケットマネーで買えなくもないですね。

ユーザテストの音声録音品質を研究してみる(3)〜ということで購入してみた機材

Pocket



ということで「ユーザテストの音声録音品質を研究してみる」の(1)(2)でUT(ユーザテスト)でどんな音を録るか、良い音声収録するのに参考にしたい基礎知識をまとめつつ、年度末予算(企業の使い切り予算というより、個人事業者はこの時期仕事が増えたり還付金があったりして懐がやや温かい的な意味でw)で機材投資をしてみましたのでまとめてみます。どれもまだ届いたばかりで実践未投入なので、是非使わせていただける機会をお待ちしています。

■ZOOM Q8

やや異様な外観をしたビデオカメラです。正確には、「音声品質を重視したビデオレコーダー」あるいは「映像も撮れるリニアPCMレコーダー」とでもいいましょうか。ZOOMというのはリニアPCMレコーダーやMTRなど音声機材を出している国産メーカーです。ここのレコーダーは特徴の違うマイクユニット(同社ではカプセルと呼んでいる)を交換して使い分けることができる、いわばレンズ交換型カメラのPCMレコーダー版のようなラインナップがあります。例えばこんな感じ。

ガジェット好きにはたまらないギミックですねw。仮面ライダーの武器のようですが、マイクは前記事で書いたように色々な目的で使い分けるものなので、理に適っていると思います。

で、このマイクカプセルをビデオレコーダーでも使えるようにした、というのがQ8というわけです。そしてもう一つユニークでオンリーワンな特徴として「XLRと標準プラグの両方が刺さるコンボジャックを2系統もっている」という点があります。XLRは業務用の2,30万クラスで大型のモデルについていたり、DSLR(デジイチ)のシューにオプションユニットとして追加できる位で、このクラスの小型のものについているのはとても珍しいです。というかこの機種しか知りません。MTRと違い所詮ステレオ2chにミックスして録音録画するビデオカメラに追加2系統で入力が増えてなにが嬉しいんだ、と思われるかも知れませんが、本機はそれらをビデオの音声に好きな音量とバランスでミックスできるのに加え、リニアPCM(WAV)で同時録音することができます。つまり動画ファイルとは別に、内蔵マイクも含めそれぞれのマイクのWAVファイルを並行して作成できるのです。動画(自在にミックスした音声入り)+内蔵マイクステレオ2ch+1ch+1chと最大4本のファイルが時間同期されて保存されます。

さすがに書き込み速度が大変なことになるので、安定動作させるためにSDXCカードもメーカー指定のExtreme Proをチョイス。WAV複数トラックでサイズも嵩むでしょうから128GBでし。

前記事に書いた「あとで音量調整や音質調整をする」という作業がマイク別に行えるので、被験者の声だけもっと大きくしたい、といったことも技術的には可能です。またWatsonなどのクラウドサービスに書き起こしをしてもらう時にも、最初から音声ファイルが分離されていた方が楽という期待もあったり。

ちょっとお高いですが、カメラカプセルを離れたところに設定するケーブルも用意されているので、背後録りで音声だけ前面、というレイアウトも可能です。

ただしカメラとしては微妙なところもあります。基本はビデオカメラというよりアクションカメラに近い仕様で120°の広角レンズで光学ズームもなしです。フルHDよりちょっとだけ高い解像度で録れますので、画角や外周の魚眼歪みが気になる場合はデジタルズームで真ん中を切り出して録ることになります。UTではそもそもそんなに解像度は不要なことが多いですが、これで足りるかは今後検証待ちです。どうも分解すればSマウントというIoTデバイスなどのレンズマウント規格のネジ式でレンズがついてるようなので、頑張ればもっと画角の狭いものやフォーカス距離が短いものに交換も可能かも知れません。Sマウントレンズはネジ固定ですがフォーカス調整も兼ねているため、ピッタリのところで接着剤で固定されてることが多いらしく、気軽につけかえとはいかなそうですが。リンク先の人はマウント自体を交換してしまうという暴挙に出たようですが、これはさすがに原型留めてなさ過ぎですね。付属のレンズフードを改造するか3Dプリンターで複製してフィルターねじをつけられればテレコン/ワイコンやクローズアップフィルターみたいなもので調整できるかも?

逆に良い点として上下反転撮影ができること。これはレンズを増したに向けて書画カメラ的に使う時に三脚ネジを向こう側に向けてられる。しかもQ8のマイク部分は角度がかわるのでマイクを話者に向けることも可能という。こんな感じ。ちょっと存在感ありすぎかなw。この距離だとX-Yマイクでもステレオ感はほぼ出ないので、エコーで声が聞きにくいということはなくそのまま音声録りにも使えそうです。

(写真)

ちなみに、「やはり映像と一緒に聞けてナンボなので別ファイルでどんなに綺麗に録れてもしょうがなくね?」という疑問もあるかも知れませんが、それこを本機と良いところで、録画開始/停止が各ファイルで一斉に行われるので基本同期がとれた状態になります。後で波形をみて少しずつズレして絵と音のタイミングを合わせる、といった作業は不要です。まぁ最近それはAdobe Premiere Proで波形解析して自動同期できることに気付いたので、ICレコーダーで同期無しで録った音でも簡単にあわせられるんですが。

■バウンダリーマイク audio-technica PRO42

そしてせっかくなのでXLRコネクタのバウンダリーマイクも買ってみました。単一指向性で比較的小型なaudio-technicaのPRO42というモデルです。

XLRコネクタのケーブルが直付けですが7.6mもあるので、背後の三脚のビデオカメラから落として床を這ってテーブルの奥側からまわすなどしても十分届くでしょう。

公式サイトで指向特性グラフを見ると、真正面(0°)から左右に60°ずつくらいは十分感度がありそうなので、その範囲に話者が入るようにすればよさそう。

実際にビデオカメラ(HandyCam CX670)内蔵マイクやICレコーダー(SX2000)
、Q8の内蔵マイク、PJP-10URと撮り比べてみましたが、PRO42はとても自然で綺麗な声が録れますね。低音も豊かです。SX2000といい勝負。HandyCam内蔵マイクはやはりゲインも高いけど背景ノイズが大きめ。Q8の標準X-Yマイクはステレオだけあってややエコーがかったような声になります。聞きにくいというほどではないですが。真正面に一人というX-Yマイクがあまり生きないテストだったせいもあります。PJP-10URも声としてはとても聞きやすいフィルターがかかってますが、自然さという意味ではPRO42かSX2000に軍配、という感じです。

また上の写真のようにQ8を書画カメラ的に近距離で使う場合は、標準X-Yマイクでもそこまでエコーが出ないので実用上は問題なさげ。気になるようなら真正面の被験者の音声がモノラルで録れるMSH-6に換装するかも知れません。

 

ユーザテストの音声録音品質を研究してみる(2)〜音声収録の基礎知識

Pocket



前回、ユーザテストではどんな収録ニーズ、要件があるのかをまとめました。それに対して、本稿ではどんな機材や設定、テクニックが有効そうか経験とリサーチでわかったことをまとめます。一部はデスクリサーチに基づき、今後注意したらよさそうと思っている、実地体験を伴わない知識もあるので、勘違いなどあれば是非ご指摘いただければと思います。個人だとそう高価な機材を扱う機会もないし、より多くの現場で適用可能な知見をまとめる意味では現実的なコスパで賄うことも考えなければならないので、マイクだけでン万円とか十数万円といった世界はちょっと除外して考えたいと思います。同様にビデオカメラなども業務用のものは範疇外としたいです(いや「業務」で使うんだけども)。

■マイクの種類

・原理の違い

大きくダイナミックマイクとコンデンサマイクがあります。ダイナミックマイクはカラオケとかで見るハンドマイクなんかで使われてて、安くて電源が要らないし、音源に近い分には十分音が拾える。

コンデンサは小さく感度が高く微細な音も拾えるが、高い、湿気の影響を受けやすい、電源が必要というデメリットも。

・使途別の形状の違い

(写真はイメージ用で、個々のリンク先商品が特別オススメということではありません。典型的な形状のものを選んでいます)

CUSTOMTRY カスタムトライ ダイナミックマイク CM-2000 (マイクケーブル付き)ハンドマイク

マイクのアイコンにも使われる棒の先端にボールがついたようなのがいわゆるハンドマイク。手に持ったりスタンドで固定して口の直近で録る前提。UTではあまり使われないです。

 

audio-technica ステレオマイクロホン(バウンダリー) AT9920バウンダリーマイク

底面がフラットで卓上に置いて使う形状のマイク。背も低くて存在感が低いのでUTではよく使います。単一指向性(後述)のものを二人の間の卓上に置けばちょうど良いでしょう。注意したいのは卓上の振動がダイレクトに響いてしまう為、キーボードやマウスの操作音、スマートフォンを置いたりもったりするゴトリ音などを大きく拾ってしまい場合があること。そんな時はハンカチを敷くなど緩衝材的なものを挟むと良いでしょう。

 

audio-technica ラベリア・マイクロホン AT829H/Pラベリアマイク

タイピンマイクとかピンマイクという親指〜小指大の小さなマイクで、文字通りタイピン型クリップなどでネクタイやシャツの合わせ目など胸元に装着して使う個人用マイクです。個々人の音がはっきり録りやすいですが、UTではいちいち了解をとって取り付けてもらうのも負担ですし、セーターなど不向きな服装もあるのであまり現実的ではないでしょう。紐(コード)がぶらさがるのもなにかとトラブルになったり行動を制限してしまいます。テレビ収録などでよくみるワイヤレストランスミッターをベルトやポケットに装着してもらうものもやはり大袈裟になって現実的ではないと思います。

FOTGA mic-01 ガンマイク スタジオ 指向性 マイク 録音/宅録/生放送/インタビュー 適用ガンマイク

少し離れたところから遠くの音を録るマイク。野外インタビューや野鳥観察などフィールドレコーディングで、周りの騒音を抑えてド真ん前の音だけ拾う超指向性をもっています。被験者の声を非装着で離れたところから拾えますが、感度によっては進行役の声が拾えなくなってしまいます。一人1本用意できればアリかも知れません。

AVANTEK コンデンサーマイク 高音質 単一指向性 3.5mmミニプラグ スタジオ 録音 生放送 ゲーム実況 PC用 MP-9ラージダイアフラムマイク

形状はハンドマイクに似ていますが、コンデンサマイクなので手持ちで乱雑に扱うものではなく、逆にショックマウントという振動を吸収する仕組みのついたスタンドで卓上やアームに固定して使います。ダイアフラムというのはコンデンサマイクの中核となる集音部品でこいつがデカイ=感度が高い、という意味の名前です。形状を表す名前が別途あるかも知れません。最近はYouTuberや歌い手など配信用ニーズが高まっているので種類も豊富です。ショックマウントが付属あるいは一体化したものもあります。

多少設置の配慮が必要ですが基本的にはバウンダリーマイクが手軽で「録ってる感」が希薄で良いと思います。ただし後述の指向性に注意してください。

・指向性の違い

指向性とはマイクがどんな範囲の音を録れるかを指す特徴です。無指向性>単一指向性>超指向性、といった順に音が拾える範囲が狭くなっていきます。双極指向性みたいな8の字的に前と後ろに感度をもつものもあります。

無指向性は全方位区別なく録れます。テーブルの両側に人がいる会議などを録ったりするのに良いですし、うっかり実際中にマイクの向きがズレてしまっても全く音が録れないというリスクは減りますが、逆に余計な背景ノイズ(空調音とか)も容赦なく広いますので良し悪しです。片側に並んで座るUTではもう少し範囲の狭い単一指向性の方が良いでしょう。ただし実際にはもう少し細かい区分(90°とか120°とか)がありますので、並んで座るか、テーブルの角をまたいで座るかによっても最適なマイクは変わってきますし、設置する向きも気をつけなければなりません。90°ならマイク正面に向かって左右に45°ずつの範囲の音しか録れないということになります。しっかり声を拾いたいからといってあまり前に近づけすぎると範囲から外れてしまう可能性もあるので気をつけたいところです。きちんとした商品には指向性を図解したものが仕様表に載っていますので確認しましょう。また少し高くなりますがシチュエーションで指向性を切換できるものもあるので候補に入れても良いかも知れません。

あと英語というかカタカナ語表記でオムニとあったら無指向性、カーディオイドは指向性を意味します。カーディオイドにはサブとかスーパーとか接頭辞がついて指向性の強さを示します。こちらが参考になります。

http://www.shureblog.jp/shure-notes/マイクの指向性:-何を、どこで、どう使う?/

・電源種別

コンデンサマイクには電源が必要です。本体に電池ボックスやバッテリーを内蔵していたり、外付けの電池ボックスが付属しているものもありますが、規格としてはプラグインパワーとファントム(ファンタム)電源があります。

プラグインパワーはビデオカメラやPCの3.5mmジャックのマイク端子から電源を供給できるものです。プラグインパワー対応端子かどうかは見た目で区別できず、カタログや仕様表でしかわからないので注意が必要です。プラグインパワー供給が必要なマイクを、プラグインパワー非対応マイク端子に挿しても音は録れません。電池式はその辺のややこしさはないですが、電池切れのリスクもあります。購入時に気をつけてプラグインパワーのマイクとカメラ(PC)を選ぶのが一番良いんじゃないんでしょうか。最近のマイク端子付きビデオカメラはほぼプラグインパワー対応な気がします。むしろ廉価機種だとマイク端子自体がないモデルがあるので、ビデオカメラ選びの段階でそこを気にしておくと良いでしょう。

audio-technica キャノンケーブル ATL458A/3.0

ファントム電源は写真のようなXLR端子(キャノン端子)を通じて電源を供給するものです。この端子/ケーブルを使うマイクの方がノイズに強いと言われますが、利用できるビデオカメラもマイクも業務用クラスのものになりますので、会議室などでゲリラ的に設営するUTでは、やや非現実的かも知れません。常設型のUTラボを設計する際はテストルームから観察室へとケーブルが長距離になるのでノイズ対策もより重要になり、XLR対応機器で組まれることが多いです。ファントム電源の電圧は何種類かあり48Vが基本ですが9Vや12Vといったものもあるので、マイクの仕様にあわせて供給機器側の設定もあわせてやる必要がある点に注意が必要です。

・マイク配置

ソニー SONY ステレオICレコーダー ICD-SX2000 : 16GB ハイレゾ対応 可動式マイク ブラック ICD-SX2000 B2本以上のマイクでステレオ録音をする時の指向性マイクの配置で、X-YとかA-BとかMSとかいう表記を見ることがあります。基本的には音楽など臨場感をどう出すかといったテクニックの話なのですが、最近のICレコーダー、リニアPCMレコーダー、外付けマイクなどでこれらの言葉が使われていることがあります。これは見た目にわかりづらいですが内部に複数のマイクがついていてステレオ録音できる場合に絡んできます。正直私もこれらをきちんと使い分けて録り比べたことがないのですが、UTの記録としてはそんなに気にすることでもないかなと思っています。そもそもインタビューなどの音声は基本的に下手に響いてしまうステレオよりモノラルで録るのが一般的だと思います。ただせっかく二人の人物を2chステレオで録れるなら、左右に定位が分かれていると、どちらがしゃべった内容か聞き分けやすくていいのかなとも思っていて、この辺りは色々試して見極めをしていきたいテーマです。

・録音機材

マイクからの音声信号を何で記録するかについてですが、まぁUTではビデオカメラで映像と一緒に記録するのが基本でしょう。映像と一緒に見てナンボのものですし。ただしより明瞭に録音した場合や、万一ビデオカメラがトラブったりした時の保険として音声レコーダーを使うことがあります。音声レコーダーにはいわゆるICレコーダーというカテゴリのものと、リニアPCMレコーダーとかフィールドレコーダーいうややお高いカテゴリのものがあります。厳密な区別は難しいですがICレコーダーは主に会議や講演など人の声を録音します。人の声の記録に高音や低音はさほど重要でない為、ファイルサイズの小ささを優先してMP3などの不可逆圧縮フォーマットを使うことが多いです。リニアPCMレコーダーはそれに対して音楽や野鳥、電車の音など芸術的、趣味的なものを対象によりリアルに収録することを目的としているのでリニアPCM、つまり無圧縮のWAVやFLAC形式、それもサンプリングレートの高いハイレゾ対応のものが多いです。マイクもそれなりに良いものや上記のX-YやMSといった臨場感高くまた自分でそれが調整できるようになってたりします。ちなみにビデオカメラも基本的には不可逆圧縮で音声を記録します。基本的にはICレコーダーカテゴリの十分でしょう。ただハイレゾが音質のリアルさ意外の面で役立つとしたら、小さい音でもノイズに埋もれず録れるという面です。万一声がすごく遠くて何いってるか聞きづらい時でも、ソフトウェアで音質を保ったまま音量を上げられます。デジタル録音では既定のレベルを振り切った大きな音はクリップといって切り取られてしまいます。これを防ぐためには一番大きな音でもクリップしない範囲に録音レベルを下げて録音しますが、これをやりすぎると今度は小さすぎて聞き取れないということになります。ハイレゾ録音ではこの音量方向の解像度が高いので、低めのレベルで録っても後で調整が聞くわけです。ちょうどデジカメで高画素数のカメラで撮った写真は、一部を拡大しても綺麗に見えるのと同じです。この音量方向の解像度を示すのが量子化ビット数という数値になります。例えば16bitだと音楽CDと同じ。ハイレゾだと24bitとかです。パット見そんなに違わないようですが1bitの違いは解像度が2倍になることを意味してるので、16->24bitでは2の8乗=256倍の解像度をもってることになります。つまり24bit収録してあれば256倍に拡大(音量増幅)しても16bit収録相当の音質を保っていられるわけです。後工程で大きくする手間を厭わなければ、もう録音レベルとか気にしなくて良いとすら言えそうです。社内で内製のUTで、万が一取り損ねたセッションや区間があっても「まぁいっか」で済むプロジェクトなら正直そこまで気にすることもないでしょうが、納品物として万一にもミスは許されない場合や、あとでしっかり書き起こししたい場合などにはハイレゾやリニアPCM録音、そして後述のノイズ対策にこだわってみてもいいかも知れません。

・ノイズ対策

UTやインタビューの記録では基本的に人の声以外はノイズです(製品が出す効果音や音声など一部例外はあるでしょうが)。できれば排除したいです。声がノイズに埋もれて聞き取りづらいと聞き返していてストレスになります。特に後でしっかり書き起こしもするようなケースではしっかりノイズ対策して聞き取りやすい収録を心がけたいものです。

UTは基本室内録りなのでありがちなノイズ源としては空調音や打鍵音/クリック音などの操作ノイズ、あとはケーブルを長く引き回した時にのりやすい電気的信号的なノイズ(ホワイトノイズとかヒスノイズといわれる「サー」という音)があります。良いマイク/録音状態で声だけが大きく録れていればこれらはあまり気にならないですが、声の録音レベルが小さくなればなるほど、これらのノイズと相対的に音量差が小さくなり聞き取りづらくなります。再生音量を上げてもノイズも一緒に大きくなるだけであまり聞きやすくはなりません。しかもクシャミや咳、爆笑といった突発的な音で耳を痛めるリスクすらあります。声は大きく、ノイズは小さく録る(S/N比を高める)工夫が重要です。

今はデジタル加工ソフトも進化していて後からノイズを消すことはある程度、というかかなり綺麗に消せますが、手間を考えると最初からS/N比が高く無加工ですぐ分析や書き起こしに使えるに越したことはありません。ただどうしても重要なセッションで手間暇掛けてでも聴ける状態に加工した場合はそういう手段もあると憶えておくと良いでしょう。個人的に最近使い始めてるのはAdobeのAudition CCというツールです。またCUIでフリーのSoXというソフトもコマンドラインからかなりの加工ができるので、10セッション分の音声データを一括加工、とかいった場合に憶えておいて損はないと思います。

さて、話を戻して録音時のノイズ排除について。まず空調音のノイズはICレコーダーなどだったらローカットフィルター(もしくはハイパスフィルター)をオンにしておくと良いです。

打鍵音などの操作音はテーブルの振動を通して伝わる部分もあるので、バウンダリーマイクなら下にハンカチや防振マットのようなものを敷くと良いでしょう。三脚ネジ穴のついたマイクやICレコーダー用には、最近こういうショックマウントを見つけました。

これは上側が三脚ネジ(1/4インチねじ)になっているので、ねじ穴がついているICレコーダーなら取り付けられます。ただし下側がビデオカメラのシューマウントになっているので、これを外し、別途下記のネジ後継変換アダプタが必要になります。

効果の程は次の実査で試してみたいと思います。

以上、マイクにまつわる専門用語や規格について、UT文脈で向き不向きをまとめてみました。

ユーザテストの音声録音品質を研究してみる(1)〜そもそもどんな音を録るのか

Pocket



最近、音声ファイルを書き起こしするフロントエンドアプリの開発している関係でこの本を買って読んでみたところ、色々とビョーキが出て音声収録機材を刷新したくなりましたw。この本、雑誌連載をまとめたもので、区切りが短く基礎的なことからまとまってて、普段なんとなく使っていた用語や概念の再整理ができてとても参考になりました。映像作品やライブ収録する人だけでなく、今だとインタビュー収録や自撮りネット素材作りなど幅広いニーズがあると思います。

■普段撮る/録るもの

さて、今の仕事でσ(^^)が収録機材を直接用意する必要はないので、どちらかというと普段のUT(ユーザテスト)やインタビューを撮るためのものです。UTだと映像も画面収録などで合わせて行います。その意味で、ビデオカメラの位置が被験者さん(モニターさん)の背後からディスプレイを撮ることも多いのですが、カメラ内蔵マイクだと遠くなってしまうので、外付けでマイクだけ卓上に置いたりするのが望ましいです。PCなどで直接画面収録ソフトで録画する場合は(ノートPCの内蔵マイクはいまいちなので)Webカメラのマイクを使ったりもします。お気に入りは先日も紹介したYAMAHA PJP-10URやLogicoolのWebカメラなど。

(このPJP-10UR、生産完了が発表されました。近日中に入手不可能になるので代替推奨品を探すことも特集の目的としたいです)。

また最近はクラウドサービスによる書き起こし(Speech-to-Text)が発達してきて、完璧とまでは言わないまでもそこそこの精度の書き起こしが、安く速く利用できるようになってきたので、分析や納品物としてテキスト化も視野に入れていきたいと考えており、収録音声の品質に気を配っていくというのを今年のテーマにしようと考えました。

一般的なUTでは1-on-1つまり被験者さんと進行役(私)の二人が並んで座り、被験者さんがPCまたはスマートフォンを操作している様子と会話を録ります。部屋はクライアント社内の一般的な会議室を使うことが多く、ほぼほぼ静かですが、場合によって隣室からの音が漏れ聞こえてきたり、空調音が気になったりします。またバウンダリーマイクやICレコーダーを卓上に設置すると、キーボードやマウスの操作音がやたらうるさく入って煩わしさを感じたりすることもあります。

今関わってるプロジェクトでは個々人の発言にフォーカスを当てるので話者別トラック収録が重要になっていて、一人一人の話者にマイクとつけたりしますが、UTでは今のところそこまでの必要はありません。ただもしテープ起こし業者に投げるならステレオでなんとなく二人が左右に分かれて聞こえると喜ばれるかな、くらい。WatsonなどのSTTサービスがそういう定位情報を話者特定に利用しているかどうかは不明ですが、もし効果があるならそういうことも重視した方がいいのかも知れません。ともあれ現状ではインカムやラベリアマイク(タイピンマイク)で一人ずつ収録ということは希です。60分や90分で次々被験者がかわるので、その都度マイクを身につけてもらったりするのも面倒ですし、そもそもあまりそういう録音を意識させない方が率直にくだけてしゃべってくれるような、収録慣れしていない人が相手ですので。その意味で、手持ち機材ではSONYのICレコーダーICD-SX2000が2つの単一指向性マイクを個別に角度調整できるので、二人の真ん中においてそれぞれに向ける、というセッテイングくらいが手頃な感じ。

今までメインで使ってきたのは、

・背後から三脚に乗せたビデオカメラでディスプレイを撮る場合

歴代のHandyCamを使い、アクセサリシューに取り付ける純正オプションのBluetoothワイヤレスマイクを使います。

マイクだけを正面の卓上に置いておけば、背後からの撮影でも声はよく拾えます。私はこれの前々モデルくらいのを使っていますが、現行モデルはマイクユニットに外付けマイク端子がついてるので、更にバウンダリーマイクやラペリアマイクをつけられるのも良いですね(あまり指向性の高いマイクを使うと、二人のうち一人の声しか拾えなくなるので注意が必要です)。なおアクセサリーシューがない他社カメラでも、マイク入力があればこっちが使えます。

これらはさほどメカに強くないインタビューワーでも簡単に扱えるのでオススメなのですが、最大の欠点はマイク側の電池がいつのまにか切れていて音声が途中から全く録れてないという状況がしばしば起きるということです。節電のためにセッションの合間にスイッチを切っておいたりすると、これまた入れ忘れたまま始めちゃうことも…

親機側で電波が拾えない時は自動でカメラ内蔵マイクに切り替わってくれたり、せめてアラート音でも鳴らしてくれればいいのですが、少なくとも私がもっている世代のマイクとカメラの組み合わせでは、マイクが切れていても文句もいわず黙々と無音映像を撮り続ける仕様です。

・書画カメラでスマホ画面を撮る

モバイルデバイスのUTでは背後からの三脚撮影は難しいのです。被験者の姿勢変化に追従しないとなので。そこでオススメなのがiZiggiのような小型のUSB書画カメラです。

「このカメラの下で操作してください」とか、カメラ画角範囲を示す紙テープをテーブルに貼って「この四角の中で」などとお願いしておけば万事OKですUSBでつながったツール画面上で露出やフォーカスがあわせられるのも便利。

以前はWi-Fiで映像をとばせるモデルもあったんですが、残念ながらなくなってしまったようです。

・画面キャプチャー収録をする場合

感想戦などで被験者さんが「ここに気付いてませんでした!」とかって画面を指さしたりする様子が録れないという欠点がありますが、最近はPCやスマホ自体で画面キャプチャーをしたり、スマホ画面をAirPlayや外部モニタ出力でとばしてそれを録画することもあります。AirPlayやMiracastならPC/Macの仮想レシーバーソフトがあるので、リアルタイムでPC画面に映し、それをPCの画面キャプチャーで録ったりできます。iPhoneとMacの組み合わせならUSBケーブルでつなげばQuickTime Playerで追加投資なしで録画/録音までできちゃいますね。端末からケーブルを生やしたくない場合はAirPlayでとばして、AirServerReflectorといったソフトで受けて録画するのも便利です。

そういう際でもマイクはノートPC内蔵マイクは排除したいです。経験上MacBookのマイクなら比較的マシですがWindows機は千差万別。また打鍵音クリック音などがダイレクトに入りまくってしまうものも多いです。以前書いた本でも今書いてる本でも各種セミナーでも「マイクはケチるな」を強調しています。

と、なんだか機材紹介アフェリエイト記事みたいになってしまいましたが、私がやっている規模のUTだと概ねこんなセッテイングパターンが多いです。もしくはきちんとした天井カメラやバウンダリーマイクが固定設置された専門ラボを使うか、ですね。

録りたいのはほぼ人の音声のみなので、映像作品やライブ/コンサート/舞台収録ともちょっと目的が違います(ググるとこういう用途でも機材レビューや解説が圧倒的に多い)。また人の声も忠実に再現するというよりは「何て言ったかはっきり聞き取れる」「何時間も聞いて疲れない」ことが大事だったりする気がします。まぁ感心したとか驚いた、困ったといった感情的なトーンはキャプチャーできるに越したことはないですが。あと出張UTでは手軽に設営できることや、バッテリーマネジメントが簡便なこと、安定して録れること(電波環境で途切れたりしないとか)、撮って出しですぐファイルで納品できること、などが理想としてある感じですかね。

その(2)では、そういう収録に特化した機材や技術についてリサーチした結果をまとめ、その(3)で実感的に購入してみた機材のレビューをしたいと思います。

動画眼のソースコードをGitHubで公開しました

Pocket



久しぶりに要望があったので動画眼のソースコードをGitHubに公開しました。

https://github.com/do-gugan/Do-gagan

Issue(機能要望やバグ報告)なども書き込めますのでよろしければご利用くださいませ。

急ごしらえしたのでファイルが足りているかわかりませんが、新規クローンでビルドできたので多分大丈夫だと思います。

15年も前のVB.NETコードに継ぎ足し、というかツギハギしてきたものなので小っ恥ずかしいですが、、、

そろそろC#にしてXamarin.FormとかでmacOSでも動くようにできたらなぁとは思いつつ、なかなか本業が忙しくて着手できずにいます。どれくらいニーズがあるのかもあんまりよくわからないので、本気で欲しいという方はお知らせいただければと思います。声が多ければ腰を上げる可能性が高まります(笑)。

 

動画眼に検索機能を追加しました

Pocket



初期バージョンリリースから13年を経て今更ながら動画眼に検索機能をつけました。今までなかったのかよ!と(笑)。今回Watsonによるテキスト起こしデータを流し込んでみて初めて気付きました。本来は自分でテキストを入力していくものというイメージだったのが、そうでないテキストデータを流し込んでビューワー的に使うコンテクストになって、これは検索ないと不便だぞと。

一応逐次検索と一括全選択(件数報告付き)ができるようにしてみました。

その他、.NET Frameworkを4.7にしてHiDPI(高解像度)なモニタの機種でフォントが綺麗になったかも知れません(実感できておらず)。またWindows10でフォーカス色が濃い青になり黒い文字と相性悪かったので色を薄くして水色にしてみました。

アップデートはCliceOnceでお願いします。手順がよくわからない方はこちらを参考にしてください。証明書は相変わらずついてないです、ごめんなさい。