閉じる

の情報処理機構に基づく
行動モデルの構築と
実験的手法や
データ駆動的手法による検証によって
人間の行動原理を探求し、
社会への応用を目指します

脳の情報処理機構に
基づいて、
人間の行動原理を探求

人間は環境とインタラクションしながら意思決定や学習を行う主体であり, その行動には主体の特性に加え環境側の特性も反映されます. 本研究室では, 人間をそれを取り巻く環境も含めて理解するために, 脳の情報処理機構に基づく行動モデルの構築と, 実験的手法やデータ駆動的手法による検証によって, 人間行動の原理探求を行うとともに, 社会応用に関する教育研究を行います.

Join

大学院生として
研究室見学
研究室見学はいつでも受け付けています. 「いつでも見学会」に詳しい情報があります. 当研究室はオンライン・オンサイトどちらでも対応可能です.
インターンシップ
研究内容をもっと知りたい場合は、「インターンシップ」も受け付けています. 当研究室への進学を検討している人が対象です. 時期や期間、内容については応相談です. 強化学習やヒトの意思決定モデルに関するレクチャーとプログラミングや行動実験の実習から構成される1~2週間のプログラムを準備しています.
次回のインターンシップは2024年8月に開催する予定です. 午前にレクチャーを受け、午後に実習を行う形式です. 実習の内容は、人の意思決定の数理モデルを用いたシミュレーションや、実際に行動課題を実施していただき、そのデータ解析などを予定しています. 詳しい内容を知りたい場合は、問い合わせフォームから問い合わせください.
研究者として
日本学術振興機構の特別研究員(PD) の受け入れをしています. まずはご相談ください.

Research

研究方法
本研究室では, 強化学習などの学習の数理モデルを用いた計算論的アプローチと, ヒトを対象とした実験的アプローチを組み合わせて研究をおこなっています.
また大規模脳・行動データベースのデータを用いたデータ駆動型アプローチも可能です. 詳しい研究内容については,下記”Research Topics”を参照ください. 脳波やMRIを用いた脳計測実験は, ATR脳情報通信総合研究所で実施します. ATRは奈良先端科学技術大学院大学(NAIST)から車で約15分の距離にあります.
研究室の指導方針
まずは興味のある研究テーマについて先行研究を読み込んでもらい, 時間をかけて研究テーマを決めていきます. テーマが決まれば, 実験計画の立て方, データ解析方法, 結果のまとめ方, 発表方法などについて指導しながら進めていきます. 特に脳画像計測実験を伴う研究テーマの場合は, 実験的手法およびデータ解析手法のトレーニングに時間をかけます.
指導体制
週1回の研究室ミーティングや個人ミーティングも定期的に行います。田中はATR脳情報通信総合研究所の数理知能研究室(NCD)の室長を兼任しています. ATRのメンバーとも密に連携しながら研究を進めることができます.

Research Topics

  1. 1.時間割引の脳内モデルの解明に関する研究

    環境との相互作用により試行錯誤で最適行動を学習する理論的な枠組みである「強化学習」は, ヒトを含む動物の意思決定の脳の数理モデルとして提唱され, 脳の回路や物質系の振る舞いが調べられてきた. 申請者らは, 報酬予測に関わる脳機構を解明するために, 健常者を対象として非侵襲脳機能計測の一つであるfMRIを行い, 長期的な報酬予測および短期的な報酬予測を行うマルコフ決定問題での行動および脳活動データを, 強化学習モデルを用いて解析した. その結果, 皮質―線条体回路の腹側部が大きい割引率での予測に, 背側部が小さい割引率での予測に関わるという, 脳には異なる割引率での報酬予測が並列的に行われていることを明らかにした.

    Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, and Yamawaki S. Prediction of Immediate and Future Rewards Differentially Recruits Cortico-Basal Ganglia Loops. Nature Neuroscience 7(8), 887-893, 2004 Link

  2. 2.時間割引とセロトニンに関する研究

    時間割引には脳内物質のセロトニンが関わるという先行研究が, 主にラットを用いた動物実験で報告されてきたが, ヒトでは統一的な結果が得られていなかった. そこで申請者らは, 割引率とセロトニンの関係を調べるために, すぐに得られる小さい報酬と時間のかかる大きい報酬を選ぶ「異時点間選択課題」を開発し, 人為的に脳内セロトニンのレベルを調節した状態で課題実行中の行動ならびに脳活動を測定・解析した. その結果, セロトニンが通常レベルでは複数の割引率での報酬予測が線条体の腹側から背側に分布するという先行研究と一致した結果が得られた. 一方, 低下時には線条体の腹側部が, 過剰時には背側部が優勢となるという, セロトニンの働きによる線条体の活動の変化を明らかにした.

    Tanaka SC, Schweighofer N, Asahi S, Shishida K, Okamoto Y, Yamawaki S, Doya K. Serotonin Differentially Regulates Short- and Long-Term Prediction of Rewards in the Ventral and Dorsal Striatum. PLoS ONE 2(12), e1333, 2007 Link

  3. 3.時間割引の偏りと問題行動に関する研究

    時間割引は, 経済学でも扱われる研究テーマであり, 近年は多重債務や肥満といった社会・健康問題との関連性が指摘されている. また精神疾患の症状や思春期の行動特性として見られる衝動性のモデルとして用いられている. そこで, 申請者らは意思決定モデルのパラメータと疾患や問題行動の関係を明らかにし, 社会・健康問題の理解や予防への貢献を目指した研究を行っている. 割引率が高く, 報酬と損失の割引率の非対称性 (符号効果) がない人ほど多重債務や肥満の割合が高いという経済学研究を受けて, 符号効果の脳機構を解明する実験を行った. 「報酬および損失の異時点間選択」実験課題を用いた実験において, 被験者の行動データから割引率を推定し, 符号効果 (行動での報酬と損失の時間割引率の非対称性) の見られた群と見られなかった群での脳活動を比較した結果, 符号効果という行動における報酬と損失に対する非対称性が, 線条体の活動における報酬と損失に対する非対称性に起因することを示唆する結果を得た.

    Tanaka SC, Yamada K, Yoneda H, Ohtake F. Neural Mechanisms of Gain–Loss Asymmetry in Temporal Discounting. The Journal of Neuroscience 34(16), 5595-5602, 2014 Link

  4. 4.時間的信頼度割付の偏りとセロトニンに関する研究

    異時点間選択で「すぐにもらえる小さい報酬」を頻繁に選ぶという衝動的選択は,割引率が高い場合に遅延報酬の重みが小さくなることで生じるが, 学習において得られた遅延報酬が直前の行動としか関連づけられない場合でも起こりうる (信頼度割付問題). これを検証するために, セロトニンのレベルを人為的に操作した状態で, 過去の行動と現在の報酬の間に時間的な遅延が発生する学習課題の行動から被験者の時間的信頼度割付の減衰率を推定した. その結果, セロトニンレベル低下時は通常時と比べ, 損失に対する時間的信頼度割付の減衰率が大きくなることを明らかにした. この結果から, セロトニンは将来の時間スケール (報酬予測の割引率) および過去の時間スケール (時間的信頼度割付の減衰率) の両方に関わることが示唆された.

    Tanaka SC, Shishida K, Schweighofer N, Okamoto Y, Yamawaki S, Doya K. Serotonin affects association of aversive outcomes to past actions. The Journal of Neuroscience 29(50), 15669–15674, 2009 Link

  5. 5.データ駆動型アプローチの導入

    上記3, 4で紹介したような, 「仮説検証型」アプローチを精神疾患患者へ応用することで, 精神疾患のメカニズムを数理モデルとして理解する「計算論的精神医学」という動きが盛んになっている. その一方, 脳・行動の多変量データと機械学習を組み合わせた「データ駆動型」アプローチにより, 特定の仮説にとらわれず”holistic”に精神疾患や個人特性のメカニズムを理解しようとする試みがなされている. その例として, 安静時の脳の結合パターンを用いた疾患の判別や, バイオタイプの同定, さらには個人特性の予測などが挙げられる. しかし精度が高くかつ汎化性能の高いデータ駆動型解析には, 大量のデータおよびうまく特徴量を抽出するアルゴリズムの開発が必要となる. 申請者は, 大規模データと各データセットの特性に合わせた効果的な機械学習アルゴリズムを用いることで, 様々な不安に共通する脳基盤を解明した. 不安を惹起させる課題中の脳活動データと, 日常に感じる不安特性と関連する安静時脳活動という異なるタイプの「不安」を反映する脳活動データに対して, 特徴量を取り出し低次元化することで, これらの「不安」に共通する脳ネットワークを同定し, この脳ネットワークから不安に関わる疾患患者を判別可能なことを確認した.

    Takagi Y, Sakai Y, Abe Y, Nishida S, Harrison BJ, Martínez-Zalacaín I, Soriano-Mas C, Narumoto J, Tanaka SC. A common brain network among state, trait, and pathological anxiety from whole-brain functional connectivity. NeuroImage 172, 506-516, 2018 Link

  6. 6.強迫症の数理モデルの構築と検証

    ヒトは環境から与えられる報酬や損失に基づいて, 行動を適応的に変化させながら生活していると考えられており, 近年その行動の理解は強化学習モデルを用いて深められてきた. 報酬・損失からの学習には, それぞれ皮質線条体回路の直接路・間接路が深く関わると考えられている. 学習において報酬や損失といったフィードバックは, 多くの場合行動から時間的に遅れて与えられるため, 上記4で述べた信頼度割付問題が発生する. それを実行する機構として, 適格度トレース(eligibility trace)という時間とともに減衰する記憶のトレース信号の存在が想定されている(Sutton & Barto 1998). 理論的には, 適格度トレースの減衰速度は, 報酬予測エラーが正であったときも負であったときも同じであることが求められるが, これらが皮質線条体回路の直接路・間接路に分かれてコードされていると仮定した場合, この減衰率はアンバランスとなる場合があることが想定される. 我々はこの場合に, 強迫症に見られる繰り返し行動のような非適応的行動が生じると仮説を立て, シミュレーションおよび行動実験をおこなった. その結果, 適格度トレースの減衰パラメータのバランスが取れている場合は, 繰り返し行動は決して強化されないが, 極端なアンバランスが存在するときには異常な繰り返し行動が強化されることを発見した. さらに強迫症の患者を対象とした学習課題の行動データから適格度トレースの減衰率を推定した結果, シミュレーションを支持する結果が得られた.

    Sakai Y, Sakai Y, Abe Y, Narumoto J, Tanaka SC. Trace Imbalance in Reinforcement and Punishment Systems Can Mis-reinforce Implicit Choices Leading to Anxiety. bioRxiv 2020.08.07.241588 Link

  7. 7.大規模脳・行動データベースの構築と利活用

    昨今, 結果の再現性の担保は科学分野全体の大きな課題となっているが, 脳研究でも再現性の担保のために様々な試みがされている. その中でも, 十分な統計力を保証するためのデータの大規模化およびデータシェアリングは最も重要とされている. 複数機関によるヒト脳MRI大規模データベースプロジェクトのメンバーとして, 世界的に貴重な多施設・多疾患脳 MRI データベースの構築と公開をおこなった.

    Tanaka SC, Yamashita A, Yahata N, Itahashi T, Lisi G, Yamada T, Ichikawa N, Takamura M, Yoshihara Y, Kunimatsu A, Okada N, Hashimoto R, Okada G, Sakai Y, Morimoto J, Narumoto J, Shimada Y, Mano H, Yoshida W, Seymour B, Shimizu T, Hosomi K, Saitoh Y, Kasai K, Kato N, Takahashi H, Okamoto Y, Yamashita O, Kawato M and Imamizu H. A multi-site, multi-disorder resting-state magnetic resonance image database. Scientific Data 8, 227, 2021 Link

Member

特任准教授

田中 沙織 Saori C. TANAKA
田中 沙織 Saori C. TANAKAA
Link
ResearchmapGoogle Scholar

特任助教

荻島 大凱 Hiroyoshi OGISHIMA
荻島 大凱 Hiroyoshi OGISHIMA
Link
Researchmap
Wendyam Eric Lionel Ilboudo
Wendyam Eric Lionel Ilboudo
Link
Google Scholar

客員助教


川島 一朔
Issaku KAWASHIMA, ATR

委託教員


酒井 雄希
Yuki SAKAI, ATR

学生

佐野 海士

佐野 海士
Kaito SANO
D1

Gao Yulun

Gao YulunD1


中川 綾子
Ayako NAKAGAWA
M2


大西 達也
Tatsuya ONISHI
M1


白川 琢磨
Takuma SHIRAKAWA
M1


成田 大祐
Daisuke NARITA
M1


西谷 香紀
Kano NISHITANI
M1


児玉 創太郎
Sotaro KODAMA
M1


渡邉 奈緒美
Naomi WATANABE
M1

Alumni


Erik HAINZLMEIER
Technical University of Munich


小池 教
Minori KOIKE

Publications

  1. Link

    Researchmapを参照してください.
    https://researchmap.jp/xsaori/published_papers

Funding

現在受給中の研究費(外部資金)は以下のとおりです.

  1. 科研費・学術変革領域研究A(文部科学省)
    期間(年度):2021~2025年度
    研究開発課題名:大集団脳科学による個体脳ー世界相互作用に基づく人間の当事者化の脳行動モデル構築(領域名:「当事者化」人間行動科学:相互作用する個体脳と世界の法則性と物語性の理解)
    研究開発代表者又は研究開発分担者の別:計画班代表者
  2. 安全保障技術研究推進制度(防衛省)
    期間(年度):2021~2025年度
    研究開発課題名:メタ認知の脳情報基盤解明と日常トレーニング環境の構築
    研究開発代表者又は研究開発分担者の別:研究開発分担者
  3. ムーンショット型研究開発事業(国立研究開発法人科学技術振興機構)
    期間(年度):2022~2026年度
    研究開発課題名:仏教・機械・脳科学で実現する安らぎと慈しみの境地(ムーンショット目標9「2050年までに,こころの安らぎや活力を増大することで,精神的に豊かで躍動的な社会を実現」)
    研究開発代表者又は研究開発分担者の別:課題推進者
  4. 脳神経科学統合プログラム(中核拠点)(国立研究開発法人日本医療研究開発機構(AMED))
    期間(年度):2023~2029年度
    研究開発課題名:脳データ統合プラットフォームの開発と活用による脳機能と疾患病態の解明
    研究開発代表者又は研究開発分担者の別:分担者
  5. 科研費・基盤S(文部科学省)
    期間(年度):2024~2028年度
    研究開発課題名:拡張環世界との相互作用における霊長類セロトニン機能の理解
    研究開発代表者又は研究開発分担者の別:分担者

Contact

奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域
計算行動神経科学研究室(情報科学領域 B棟6階)

問い合わせはこちら(Googleフォーム)

NAIST 情報科学領域