脳・神経科学に基づく運動学習について

【医療者向け】運動学習

運動学習

運動学習は【訓練・練習といった目に見える運動行動】【自己の内面に蓄積される目に見えない記憶】を通じて永続的に運動パフォーマンスが変化していくことを指します。

運動学習は【連続的運動学習】【適応的運動学習】に分類されることが多くあります。

【連続的運動学習】
運動順序に関する知識を獲得すること
・ある課題における身体の操作手順に関する知識を獲得すること
大脳基底核が速い学習・遅い学習、学習保持に対して主に関与
【適応的運動学習】
感覚情報に基づいて行う運動学習
・外界の条件に従いその変換プロセスを学習する手続きを示し、主に道具を使用した運動・操作
小脳がそれぞれの期間において関与

これらはそれぞれ独立して活動しているわけではなく、大脳基底核小脳視床を介して互いに接続があり、それぞれの機能を補完し合いながら相補的な活動を行っていることが確認されています。

運動スキル課題における脳活動の特徴

運動学習の研究では鉄球回し課題がよく用いられます。

運動学習時には両側性の運動関連領域が活性化することが分かっており、特に運動前野の両側性活動が大きく運動学習に影響を与えていると考えられています。

実際に右手の運動学習時の技能向上率と同側運動前野の活動は強い相関関係が認められ、これは左手も同様であることら運動学習を行っていく過程で、同側の運動前野の活性化が必要であると示唆されます。

しかし、対側の運動前野が運動学習に関わっていないわけではなく、運動スキルが要求される難易度の課題を実行するためには両側性の運動関連領域の活動が必要です。

運動学習時の脳の再組織化

運動学習時に脳では再組織化が生じています。

脳の再組織化には2つあり、構造的な組織化と機能的な組織化があります。

脳の構造的組織化:灰白質の増大・白質繊維の変化
脳の機能的組織化:脳内神経ネット―ワークの結合・変化

運動学習率が高い者ほど、楔前部や後帯状回の灰白質が大きいと言われています。

また、長期的な学習における運動パフォーマンスの向上と一時運動野・頭頂葉・前補足運動野の灰白質増大には正の相関関係があります。

さらに運動学習の長期保持と両側背外側前頭前野・補足運動野の灰白質の大きさには正の相関があります。

以上から運動領域・頭頂葉・後帯状回などに病変を持っていたり、前頭前野の委縮といった認知症患者では運動学習は難しくなることが予想されます。

運動学習中・運動学習後の脳活動

【運動学習中の特に活性化する脳領域】
前頭葉:両側背外側前頭前野・下前前回・運動前野
頭頂葉:上頭頂小葉
小脳:歯状核
大脳辺縁系:前帯状回
【運動学習後の特に活性化する脳領域】
頭頂葉:下頭頂小葉
大脳基底核・後帯状回

運動前野は運動スキルを求められる運動を行う際に同側の活動が運動学習に関与していることはお伝えしました。

では運動前野以外の脳領域ではどうでしょうか?

背外側前頭前野ワーキングメモリ注意機能を担い、運動学習初期には特にそれらの機能が強く必要であることが示されています。
下前頭回:言語や模倣に関わる領域であり、覚えるための表彰手続きが積極的に行われています。
上頭頂小葉:体性感覚情報処理に基づいた身体の空間的制御に関わります。
下頭頂小葉(縁上回・角回):概念形成(身体・道具の動かし方)に関わります。
小脳(同側、特に歯状核):前期は誤差学習プロセス、後期は内部モデルに基づくフィードフォワード制御に関与
前帯状回:葛藤や矛盾の処理などの情動に関与します。
後帯状回:安静時の脳活動に関与します。
運動学習時の安静時脳活動は後帯状回だけでなく、適応的運動学習課題時の安静時脳活動は前頭葉ー頭頂葉間の神経ネットワーク活性化が有意に認められています。
また、バランスボードを用いた姿勢制御課題を行った際、運動学習前半は補足運動野前補足運動野腹側運動前野において活動増大が認められています。
これらの領域は運動計画・シュミレーションに関与し、補足運動野では運動後の動画を用いた自己運動観察を行った際にも活動増加が認められています。

運動学習様式と脳機能

【大脳基底核】
・連続的学習
・強化学習
【小脳】
・適応的運動学習
・教師あり学習(誤差学習)
【大脳皮質】
・教師なし学習(記憶・身体イメージや注意とワーキングメモリに基づいた学習)

強化学習

連続的運動学習と適応的運動学習についてはお伝えしたので強化学習についてお伝えしていきます。

強化学習とは、とある環境下において主体が現在の状況を観測し、とるべき行動を決定する機械学習の一種を言います。

主体となるヒトは行動を選択して実行し、その実行した行動から報酬が得られるとその行動は強化されます。

この報酬は直接的な報酬だけでなく遅延報酬にも対応しており、さらに報酬予測時にも働くから強化学習は報酬系の作動によって生じるので報酬学習とも呼ばれています。

強化学習と脳神経経路

強化学習に大きく関わる領域は中脳ドーパミン作動系ループと言われています。
ドーパミン作動系は黒質と腹側被蓋野から放出されています。
中脳:黒質緻密部から線条体への投射は運動の発現に関与(上図)
腹側被蓋野:大脳辺縁系や側坐核、前頭前野や前帯状回に投射し、意欲に関与
このドーパミン神経細胞は【行動を起こすときに得られる期待される報酬の量】と【行動をとった結果、実際に得られた報酬の量】の誤差に応じて興奮し、その興奮の度合いに比例して行動を起こすのに関与した神経結合のシナプス伝達効率を向上させることが分かっています。
そして、予期しない・予期した以上の報酬が発生した場合に強化学習を高めると想定されています。
ドーパミン神経細胞の興奮性は以下の特徴があります。
・報酬が完全に予測できる状況:反応しない
・報酬予測だけで活動
・予測した報酬よりも報酬が少ない:反応が減少
最初の行動に対する報酬はほとんど予測できないため、報酬効果が最大となります。
そのため、同じ報酬が繰り返されることで予測できる報酬となり、学習の意欲が低下していきます。
セラピストは新たな活動や新しい文脈、新しい難易度の課題を設けて提案し続けることが必要になります。

運動学習とフィードバック

行った運動に対してセラピストは患者にフィードバックします。
ヒトは他者に褒められてもらうといった社会的報酬でも側坐核を含んだ線条体を活性化させることが分かっています。
「第三者から自分が褒められる」・「第三者から他人が褒められる」といったフィードバックの違いでは「自分自身が褒められる場合」がよりパフォーマンスを向上させることが明確になりました。
また、運動結果のフィードバックを「他者の低スコアと比較して呈示する群」「他者の高スコアと比較して呈示する群」で比較すると、他者の低スコアと比較して呈示した群で姿勢制御能力がより向上したと言われています。
以上から自身が他者より優れているフィードバックが運動学習効果を高めることが予測されるかもしれません。
しかし、フィードバックに加えて「同世代に負けていますので頑張って下さい」と「同世代より優れていますのでもっと頑張って下さい」というような激励を加えて比較すると、「同世代に負けていますので頑張って下さい」と激励した方が学習効果が高いことが示されています。
つまり…
他者との社会的な関わりの中で単に有能感を知覚するだけでなく有能感を知覚するため自己の欲求を高めるような関わり方が能動的な行動変化をもたらす可能性が考えられます。

強化学習の階層と脳領域

第1層:線条体・側坐核・偏桃体・腹側被蓋野の活動に基づく、報酬に基づく学習初期の動機づけの生成
第2層:眼窩前頭皮質の活動に基づく、価値の判断と意思決定による学習の動機づけの維持
第3層:前帯状回・背外側前頭前野の活動に基づく、将来の報酬を定め、それに向かい目標志向的に行動を認知的制御する手続き
こうした階層はヒトは目先の報酬のみで満足せずに報酬価値を高めたり修正したりしながら、その報酬感を未来に先延ばしにして、その報酬を高めるために具体的な目標を立てて、それを自己の身体行動に基づいて認知的に制御していく知性をもった生物であることを示唆

誤差学習

ヒトの上肢の巧みな動きは物を掴む・握る、そして操作するといった道具の介在によって生じます。

道具操作は意図した運動制御であり、その道具操作を制御するためには運動の学習・成熟が要求されます。

運動・道具操作が不慣れな段階では、無駄な動きや円滑化されていない筋活動が生じたりし、イメージとは異なった結果になります。

この運動学習初期の誤差が生じている段階では小脳の役割が大きく、小脳のフィードバック誤差学習が運動を成熟していくために必要なものとして認識されています。

 

運動学習初期は意図した運動予測と実際の運動結果の誤差を小脳が検出し、その誤差を大脳が修正し、末梢器官に対して適切な運動指令を送ることで運動のスキルが向上します。

運動指令は外側皮質脊髄路を通じて筋を収縮させ実運動を起こすのと同時に、運動指令のコピー情報(遠心性コピー)苔状繊維を通じて小脳皮質の平行線維に入ります。

実運動後に生じる誤差信号は下オリーブ核を介して登上線維を通じてプルキンエ細胞に入力されます。

プルキンエ細胞は誤差信号を生み出してしまう平行線維(誤った運動プログラム)を長期的に抑制し、適切な運動プログラムのみを残すように働きます。(長期抑圧)

※長期抑圧:誤った運動プログラムのシナプス伝達効率が対照と比較して長期的に減弱する現象

このプルキンエ細胞が平行線維(誤った運動プログラム)を長期抑圧することで小脳内に運動記憶・痕跡(内部モデル)が形成されます。

小脳内の小脳核から洗練された内部モデルに基づくプログラムが大脳の一次運動野に情報として送られ、運動指令が調整されます。

【運動学習初期】
誤差学習システムを用いた「教師あり学習」が作動します。「意図した運動軌跡」と「実運動の軌跡」の誤差に基づくフィードバック誤差学習です。
【運動学習後期】
誤差学習により「内部モデル:適切な運動指令」を形成することでフィードフォワード制御を可能にします。初期は小脳が後半に活性化しますが、後期は限局した小脳の活性化が起こります。

足底知覚の誤差学習と姿勢制御能力

大きさ・高さ・素材は同じだが硬さが異なるラバーマットに立った際に、マットの硬さを答える課題では、回答のエラーが減少するにつれて姿勢制御能力が安定化したことが確認されています。

運動の内部モデル

誤差学習を繰り返していくことで小脳では内部モデルが形成されていき、適切な運動指令を一次運動野に情報として送ることで運動調整がされます。この機能がフィードフォワード制御といわれています。

ヒトは今まで操作したことのない初めてみるコップを持ち上げるときも、そのコップの重さを予測し指先や上肢全体の適切な力を生成することができます。

この予測も日ごろの日常生活で使い慣れている物体から獲得した内部モデルを選択しており、運動制御は過去の経験に基づく記憶、つまり学習された内部モデルに基づいて行われるとされています。

 

随意運動における内部モデルは大きく以下の2つで構成されています。

1.順モデル
運動指令の遠心性コピーと身体からの感覚情報かた現在の状態を推定し、運動指令の結果の状態として視覚や自己受容感覚で得られるを予測
2.逆モデル
望ましい運動軌跡を実現するために必要な運動指令を予測

ヒトの円滑な運動にはこの制御システムが関与していると言われています。