こんにちは、プロダクト事業部の水野貴明&マーケティング部の上之山奈津希です。
先日、こちらでも告知したBaidu.jp不自然言語処理コンテストは、募集期間中に計26作品をご応募をいただき終了いたしました。
ここでは、4つの受賞作品(グランプリ、準グランプリ、審査員特別賞、LightningTalk*賞)の発表と、LTとスイカ割りで大盛り上がりを見せた表彰イベントの様子をレポートいたします。
*Lightning Talk(LT)=短いプレゼンテーション
受賞作品
審査会は、荒牧英治氏(東京大学 知の構造化センター 特任講師 @aramaki ) と 竹迫良範氏(サイボウズ・ラボ株式会社 @takesako )を審査員としてお招きし、バイドゥのエンジニア水野貴明(@takaaki_mizuno)と 萩原正人(@mhagiwara)共に行ないました。また、LT賞の決定には、イベントに参加いただいた約50名の皆さまの拍手の大きさで決定いたしました。
グランプリ受賞作品
Twitter上で話題になっている“空目”単語関係のグラフ化
「Soramegraph(LTの動画)」 aoda 氏(Blog)
<作品説明>
Twitterで見かける「空目した」。活字によるコミュニケーションでの「○○を××に見間違えた」体験は、空耳と掛けて「空目」と呼ばれています。この「空目」を一期一会な不自然言語と考え、Twitter上の空目Tweetを解析、単語同士を矢印でつなぐグラフを用いて可視化したものがSoramegraphです。
【受賞者コメント】
不自然言語処理と言うタイトルを見た瞬間から何か応募したいと思っていました。自分と同じ方向にエネルギーを費 やす人が集まりそうに思えるタイトルなので何らかのかたちで絡みたいと。実際予想以上に面白い人たちの作品が集まる中、幸運にも賞を頂けたのは嬉しいで す。ありがとうございます!ぜひ次回も参加させて頂きたいです。
【審査員講評】
「空目したことをつぶやく」という流行を切り取って、シンプルにうまく可視化していると思います。どんな言葉が(どんな状況で)どんな言葉に間違えられやすいかをグラフで見るのはとても楽しい。ブブゼラなど新しい言葉が出てきた際にはかなり派手なグラフになりますが、一般の言葉もどういった空目/被空目の関係の中に置かれているのか、もう少しデータが蓄積された状態でみてみたいような気がします。(水野貴明 バイドゥ株式会社 プロダクト事業部 エンジニア)
準グランプリ受賞作品
入力された文字が次々と誤字になるWebアプリケーション
「誤字ェネレータ(LTの動画)」 根岸義輝氏(Blog)
<作品説明>
不自然な日本語、glitchを実装する場合、適用の対象は文章と文字の二つのレイヤが考えられますが、ここでは文字を対象とし、誤字として表現しました。誤字を“見た目の似ている漢字”と定義、各々の漢字をラスタ画像にした際の距離を算出し、より距離の近いものをそれぞれの文字の誤字としてデータベース化しました。クエリに対する誤字の適用を次々と行い、徐々に意味が喪失する過程をビジュアライズするアプリケーションです。
【受賞者コメント】
不自然言語処理という字面を見た瞬間に応募を決めました。face to faceでは行われないコミュニケーションは、特に一定の狭いコミュニティにおいて独自の発展をすることがありますが、それらに対して一定の影響を与えられるアプリケーションを実装することができたと自負しています。今後は特に、物理レイヤで動作する非ソフトウェアな何かについて考えていきたいと思います。ありがとうございました。
【審査員講評】
とてもシンプルなインターフェースで初めての人でも使いやすい作品でした。形の似ている漢字をコンピューターで機械的に見つけるアプローチは面白く、類字辞書の自動生成やOCRの精度向上、間違って覚えてしまった漢字や読み方を知らないけど似ている漢字を知っている場合の日本語入力など、様々な分野への応用が可能な技術だと評価しました。今後、対象文字の拡大や精度向上などの課題を解決するとともに、発展的なアプリケーションの派生を期待いたします。(竹迫良範氏 サイボウズ・ラボ株式会社)
審査員特別賞受賞作品
そっけないメールしか書けない人向けのそっけなくない返信メールツール
「感情のこもった返答テンプレ生成君 (LTの動画)」 fuba氏(Blog)
<作品説明>
メールなどでそっけない返事しかしないめんどくさがりの人のための、返信先のメッセージと自分のそっけないメッセージを入力として、なんとなく感情が伝わりそうなそっけなくないメッセージのテンプレを生成してくれるツールです。このシステムは、あらかじめクラスタリング済みの文の組み合わせクラスタの中から、入力された文の組み合わせと意味が近そうな文の組み合わせクラスタを抜き出し、そのクラスタを文の類似度でソートして、検索結果として返します。
【受賞者コメント】
審査員特別賞ありがとうございます! 心のこもった返事を返すのに日夜苦労している個人的な経験から発想したツールでしたが、意外と共感が得られたようで非常にうれしいです。賞金はさらにチャレンジングな技術の開発に使おうと思います!
【審査員講評】
「感情のこもった返答テンプレ生成君」は、感情が伝わりそうな返信メッセージを自動生成するという作品です。本コンテスト審査の主旨は、「コミュニケーションを豊かにする点での完成度を重視する」とのことでしたが、本作品はついおざなりになりがちなメールでのやりとりに着目したユニークな作品であり、最も審査主旨に沿った作品の1つです。どこまで実用的に使えるかは少々難しいところもありますが(感情のこもった返答は人間でも難しい!)、チャレンジング精神を評価し受賞といたしました。(荒牧英治氏 東京大学 知の構造化センター 特任講師)
LT賞 作品
入力したテキストを画像化&難読化するWindowsアプリケーション
「ケンブッリジ大学(LTの動画)」大原 一輝氏
<作品説明>
掲示板などで、書き込み内容が検索エンジンの検索結果に出てしまうのを避けるため、メッセージを画像で投稿する場合があります。しかしながら、最近のOCRは性能が高く単純な画像化では“検索避け”としては役不足だとも言われています。そこで、何らかの難読化が必要と考え、ケンブリッジ大学の有名な研究「文字の最初と最後だけ合っていれば、その間の文字の順序が異なっていても人は読める(例:こんにちは!よろしくお願いします。→こんちには!よしろくお願いましす)」に基づく不自然言語化を利用、機械に読みづらく人には読みやすいまま、入力された文字を画像化するアプリケーションを作りました。
【受賞者コメント】
言 処語理?何それ美味いしの?状態の文系でたしが、皆様の温かい拍手によりLT賞頂けて感謝感激です。沢山のご助言賜りましのたで、これらかもプロラグミン グや言語処理の勉強を続けいてきます。ハピッーなインベトを開催して頂いたBadiu、盛り上げて下さった皆様、本当にありとがう!
審査員より総評
荒牧英治氏 東京大学 知の構造化センター 特任講師
言語処理というと、文法的な文章を入力として扱うことが多いですが、不自然な言語を扱うという本コンテストは,その取り組みそのものが非常にユニークで興味深い試みです。どのような作品が寄せられるか予想がつかない中、今回グランプリとなった「soramegraph」をはじめ、用途に広がりを感じる斬新なサービス、夢のあるアプリケーションが多数集まりました。また、絵文字を扱った作品が多く、従来処理対象外とされていた絵文字がかくも高い関心を集めており、新しい言語言語現象となりつつあることを感じました。最後に、すべての作品のコンセプト、完成度ともに、ここまで高いレベルのコンテストとなっていることに驚きを感じています。ぜひ、2回目、3回目と続けて欲しいと思っています。
竹迫良範氏 サイボウズ・ラボ株式会社
たくさんのご応募ありがとうございました。応募者のみなさんの持っている様々なアイディアや技術を間近に感じることができ、審査に参加できたことを感謝いたします。審査は困難を極め、当初予定していた時間を大幅に超えました。ひととおり作品に触れるとすべてに愛着がわくもので、もっとたくさんの作品に対して賞を授与したいという気持ちが大きくなりました。最終的には審査会での合議の結果、元々予定のなかった審査員特別賞の枠も新設することとしました。
今回はモバイルWebコーパスの公開も同時に行ったためか、絵文字やサジェストを題材に扱った作品が多かった印象です。日本は近々人類史上経験したことのない超高齢化社会を迎えます。メールと言っても、手紙、電子メール、携帯メールなど世代間のコミュニケーション手段にはギャップがあります。コンピューターは01のディジタルな情報のみを扱い規格で記号化された文字を通信・介在するのみです。しかし、不自然言語処理がとりなすアナログな通信手段が、世代間や異性間のコミュニケーションのギャップを埋め、いつの日か日本の少子化対策に貢献できる時代がやってくると確信いたしております。言葉は生き物です。仲人はコンピューター、そんな時代はもうすぐなのかもしれません。
水野貴明 バイドゥ株式会社 プロダクト事業部 エンジニア
応募作品それぞれが、様々なネット上などに溢れる新しい新しく不自然な言葉のやりとりに注目していて、応募作品を見るたびに、確かにこれもあった、あれもあった、と驚かされ、その着眼点がとても素晴らしいと思いました。また、今回選ばせていただいた作品以外にも、とてもおもしろいと感じた作品は多くあり、これらの中からグランプリを決めることの難しさをとても感じました。「絵文字入りモバイルウェブコーパス」もいろいろな形で利用していただいており、公開してよかったなあ、と実感しています。このコンテストをきっかけとして、不自然言語処理という決まった枠組みのない世界に、これからも皆さんと一緒にいろいろな形で注目していければと思っています。
萩原正人 バイドゥ株式会社 プロダクト事業部 エンジニア
素っ気ない文章を絵文字や画像で飾りたてるもの、まじめな文章をどことなく「不自然」に変えてしまうもの、「不自然」な言語を検出・解析・調査して、言語現象に対する理解をさらに深めてくれるもの。さまざまな作品のご応募があり、どれも楽しく拝見させていただきました。人間の言語、特にWeb上の言語現象は本来とても「不自然」なもので、そのような状況こそがむしろ「自然」であると言えます。そのような状況をそのまま受け入れた上で、「不自然言語」に対する理解をさらに深めてくれるという点で、受賞作品はいずれも遜色の無いものでした。コンピュータによる「不自然言語」に対する挑戦は始まったばかりです。微力ながら、本コンテストが、そのための第一歩となることを願っています。
イベント(LT、表彰式、スイカ割り付き懇親会)の様子
バイドゥの代表取締役社長からの開会挨拶に始まり、LT全26品のご応募者のなかから、12名もの方に出演いただいたLT、表彰式の様子は、Ustreamで生配信しておりました。終了後も下記リンクから動画で視聴いただけます。
開会挨拶(バイドゥ株式会社 代表取締役社長 井上俊一 @toshikazu_inoue )
開催趣旨説明(水野貴明 バイドゥ株式会社 プロダクト事業部 エンジニア @takaaki_mizuno )



LT ※発表順
- 誤字ェネレータ @negipo
- Ligtran @whym
- ワラワラフォト @takayuki_h
- 感情のこもった返答テンプレ生成君 @fuba
- 絵文字サジェストツール @just_do_neet
- ケンブッリジ大学 @WaveCoiler
- 勝手にデコツイっ @taiichi84
- Soramegraph @aoda
- Ameba Photo Generator @s_wool @jojonki
- Emotics @ishisak @taki_kazu @toilet_lunch
- 絵文字ったー @satoshi_kimura
- 「ケータイウェブは本当にエロいのか?」をテーマに研究 @nokuno
ほんとにやったよスイカ割り!!
本当にやりましたスイカ割り。Baiduのエントランスをしっかり養生し、用意したスイカは6つ。
審査員と受賞者に挑戦してもらうことになり、日曜日で静かだったオフィスで、大盛り上がりしました。
LT賞受賞の 大原 一輝氏。声援の中、見事スイカはまっぷたつ!!この日一番の割りっぷりでした。
審査員特別賞の fuba氏。この頃にはアイマスクの目の飾りは取れてしまいました。
準グランプリの 根岸義輝氏。人より多く20回くらい回って挑戦!
トリはグランプリの@aoda氏。男の汗でアイマスクもじっとり湿っていたに違いありません((((;゚Д゚))))
そして最後に、割ったスイカをみんなでいただきました。
Baiduにとって、このようなエンジニアイベントは初めての試みで、誰にも来てもらえなかったらどうしようとか、応募がこなかったらどうしようという不安のなか手探りで進めており、不手際もあったかとは思いますが、結果的にたくさんの方々に ご参加いただき、ユニークでリア充な楽しい思い出をつくることができ、一同、心から嬉しく思っております。
皆さま本当にありがとうございました!
ここで宣伝。こんなBaiduは、言語処理エンジニアをただいま絶賛募集中です。ご興味をお持ちの方は、採用情報をご覧ください。
最後の最後に、不 自 然 言 言吾 処 王里コンテストのTwitterアカウント @baidu_unlp は、任務完了が確認できましたら、そのうち終了します。みなさまご愛顧いただきまことにありがとうございました。○┓ペコリ



























