データサイエンス

ビジネス課題を見極める目と“現場知”を養い
求められるデータサイエンティストに

新生ハッカソン

データサイエンス人材の育成に力を入れる新生銀行グループでは、2017年からデータ分析コンテスト「新生ハッカソン」を毎年実施している。参加者は新生銀行グループが保有する大量の金融データを分析し、ローン商品を申し込んだ顧客の1年後の貸し倒れ確率を予測するモデルを最新の機械学習手法を使って開発。その精度やアイデアの新規性・発展性を競う。

※ハッカソン
「ハッカソン(Hackathon)」とは「ハック(Hack)」と「マラソン(Marathon)」を掛け合わせた造語で、一般的にはプログラマーやデザイナーなどからなる複数のチームが、与えられたテーマに対し所定の期間集中的に作業を行い、その成果を競い合うイベントを指す。

新生フィナンシャル
リスクマネジメント本部
アドバンストアナリティクス部 兼 
新生銀行グループ経営企画部グループデータ戦略室(出向)
2018年入社

渡邉 大志

大学では量子力学を学んでいたが、実社会でより役に立つ技術を身に付けたいと、大学院に進んでAI(人工知能)やデータサイエンスを専攻した。新生ハッカソンへの参加をきっかけに、新生銀行グループには魅力的なデータが豊富にあることを知り、新たなモデル開発を担いたいと入社を決意した。

新生ハッカソンとの出会いが
金融分野の魅力を教えてくれた

大学院で人工知能、特に機械学習の研究をしていた渡邉大志が「新生ハッカソン」の開催を知ったのは偶然だった。統計学会のメーリングリストをいつものように流し読みしていたとき「データ分析コンペティション開催−新生フィナンシャル」というタイトルに目が止まったのだ。ビジネス現場の実際のデータを使ってモデル構築ができることに大きな魅力を感じてさっそく応募した。9日間にわたって「個人向けローンにおける貸し倒れ確率の予測モデルの構築」というテーマにチャレンジした。
「最初は9日間あればモデル開発には十分すぎるくらいだと感じていました。しかしその考えは甘かった。生のデータが持つ情報量の多さや厚みは想像以上でした。また、社員の方から、こういうデータも見てみたらといったアドバイスを何度かいただき、それらを試していくと時間はあっという間に過ぎていきました」。
どのデータをどう見れば意味のある示唆が得られるのか、渡邉は考え続けた。他の参加者が主にデータ間のパラメータの調整をしていたのに対し、渡邉はその一歩手前で、そもそもどういうデータが有効なのかを追求した。その地道な検討が実り、渡邉は「最も判別力が高い優れたモデルをつくりあげた」として優秀賞を受賞することができた。

グループ全体の膨大なデータにアクセスし
新商品・新サービスの開発に取り組む

ハッカソンでの受賞は修士1年目のことだったが、渡邉はそれをきかっけに将来は新生フィナンシャルで働きたいと考えるようになっていた。
「ハッカソンに参加する前、金融業界は就職先としてまったく視野に入っていませんでした。データサイエンスや機械学習の研究が活かせるのは、メーカーやデータ分析専門の企業だと思っていました」。
しかし、ハッカソンへの参加で渡邉の考えは大きく変わった。金融の世界で扱うデータは多彩で奥が深く、非常に魅力的だった。しかも分析やモデリングの結果が、お客さまが求めている商品やサービスの新規開発にダイレクトにつながっていく。その手応えも大きかった。さらに、新生銀行グループはグループ融合へと大きく踏み出しており、今後個社の枠を超えて金融に関するあらゆるデータに触れるチャンスがある。いよいよ就職活動を始めるとなったとき、渡邉は迷わず新生フィナンシャルへの入社を志望。新生フィナンシャルもデータのスペシャリストとして特別の待遇で迎え入れられた。
入社後、渡邉はリスクマネジメント本部アドバンストアナリティクス部に配属となった。すぐにプロジェクトの主担当を任され、営業本部でお客さまと直接電話応対する社員が、よりニーズの高いお客さまを見極めて架電ができるプログラムの作成にあたった。
さらに、入社1年目の秋からは新生銀行のグループデータ戦略室へ出向。主にグループ各社横断的な収益分析と予測モデルの開発を担うことになった。
「収益分析においては、グループ会社間で顧客の重なりがある点を踏まえ、整理・分析しながら、よりお客さまに即したサービスがご提供できるように知見を集めています。また、予測モデルの開発では、よりニーズの高いお客さまを特定して的確なサービスがご提案できるAIモデルの構築に取り組んでいます。金融業界で誰もやったことのないチャレンジばかりなので、大きなやりがいがあります」。

必要なのはデータの量ではない。
何が重要なのかを見抜く力だ

入社してからの2年間で、渡邉は2つのことを痛感したという。一つは、現場が何を求めているかをしっかりつかまなければいけないということだ。
「入社当初は、データサイエンスや機械学習の手法にばかり目がいって、つい覚えたての新しい分析手法を使うことが目的となっていたことがありました。いくつかの案件にかかわる中で、お客さまが何を求めているのかを考えて行動することが大切だと気づきました。最先端の手法を追うことは確かに楽しいのですが、分析手法はあくまでも手段でしかありません。お客さまのニーズやビジネス課題に応えるためにまず何が必要なのかを考えることを意識するようになり、今はそこに楽しさとやりがいを感じています」。
 もう一つ渡邉が気づかされたのは、データを本当に意味のあるものとして活用するためには、“現場知”が欠かせないということだ。
「1年目に担当した電話先の優先順位を判定するプログラムの作成もそうでしたが、ニーズの高いお客さまとはどういう人かということは、データだけを睨んでいても出てきません。そこは第一線で日々お客さまと接している営業本部の人の知見に学ばないといけない。実際、ニーズの高い人の特徴をヒアリングし、それが浮き彫りになるデータを探してモデルに組み込んだところ、精度が大きく上がったことがありました。やはりデータ上だけでは見切れないものがあります。お客さまと直接触れ合う方だからこそわかる“現場知”があるのだなと知りました」。

解きたい課題は何かを常に意識し、
ベストな提案ができるデータサイエンティストに

さまざまなセンサーの開発が進み、一方でコンピューターの情報処理能力は飛躍的に向上している。ビッグデータは今まで見えていなかったものを見せてくれる「宝の山」だ。それだけにデータサイエンティストの力量が問われる時代だと渡邉は思っている。
「データの量は圧倒的に増えています。そこから有効な示唆を導くには、データの選択や整理、クレンジングが欠かせません。何でもAIに入れたらいいというものではないからです。むしろ入れない方がよいデータもあります。解きたい課題が何なのかを常に意識し、最先端の手法もキャッチアップしながらベストな解決策を導き出す ── それが重要です。データサイエンティストには、ビジネス課題を整理し解決するビジネス力、情報処理や人工知能などに関するデータサイエンス力、そして、データを意味のある形に変えて活用するデータエンジニアリング力の3つの力が必要だといわれています。私自身、もっと学びを深め、この3要素をバランスよく身に付けて新生銀行グループのビジネスに貢献したいと思っています」。
その学びを支える風土が、新生フィナンシャルにはあると渡邉は言う。
「この会社には、最新のテクノロジーの中で良いものを積極的に取り入れながら、お客さま目線も大事するところがあると感じます。おそらくその根底にあるのは、常にお客さまのためにより良いものを追及するという、新生フィナンシャル全体の組織風土だと思います」。
最後に渡邉は、未来の後輩に向かってこんなメッセージを送ってくれた。
「外から見ると当社はデータ分析や機械学習を利用しているという印象が薄いかもしれません。しかし、実はそれらの知見が活きるチャンスが多すぎるほどある職場です。仮にデータ分析や機械学習に興味がなくても、より良いものを追及していく社内全体の風土は必ず今後の人生の糧になると思います。先輩や上司にも気軽に相談ができ、風通しも良いので、自信をもっておすすめできる会社だと断言できます」。
次代の金融業界で求められるデータサイエンティストへ ── 渡邉は意欲あふれる後輩と共に歩んで行きたいと考えている。