IBM TechXchange Data Science Japan

IBM TechXchange Data Science Japan

 View Only

中学2年生に教えるデータサイエンス#1 -円周率とモンテカルロシミュレーション-

By YOICHIRO NISHIMAKI posted 7 hours ago

  

皆さん、こんにちは。
IBM
SPSSを含むデータサイエンスのテクニカルセールスを担当している西牧です。

私はご縁があり、2018年から毎年、玉川学園中学部2年生向けに出前授業を行っています(詳しくはInstagramをご覧ください)。
学習指導要領の改訂で中学2年生のカリキュラムに統計が加わりましたが、「生徒たちにどうやって興味を持たせたらいいかわからない」「社会の中で統計やデータサイエンスがどのように役立っているのか教えてほしい」とご依頼いただいたのがきっかけです。

大人には通じる理屈や事例も、中学生には簡単には伝わらず、楽しくわかりやすく説明することの難しさを痛感しながらコンテンツを作ってきました。
ある日、試しにその教材をクライアント向けのプレゼンでも使ってみたところ、とても好評で、「もしかすると、大人が本質を理解するヒントにもなるかもしれない」と思い、このブログで紹介することにしました。

このブログでは、中学生向けの授業で私がどのように統計やデータサイエンスを教えているのか、その工夫や演習の内容をご紹介していきます。

連載2回目以降はコミュニティ限定記事にする予定ですのでIBM id でログインした上JOINボタンでコミュニティ会員になってからぜひお読みください。

 

 

円周率を取り上げた背景

 

かつてPCを手掛けていた頃とは違い、現在IBMの知名度は悲しいほど低く、私の出前授業では「IBMとは何か」を説明するところか始まります。そしてIBMのシンボルであるスーパーコンピューターの話題を毎回持ち出して、その偉業と共に、生徒も馴染みのある円周率3.1415以降の数兆桁を求められる能力に触れていました。

それに加えて2025年の演習を何にするか思いを馳せていた折、SPSS Modelerのあるユーザーと再開する機会がありました。その方が以前、ご自身のブログで円周率をモンテカルロシミュレーションで解くSPSSのプロセスを解説されていたことを思い出し私も10年以上ぶりにチャレンジすることに。すると当時はなかったシミュレーション機能のおかげで、当時より圧倒的にシンプルかつ正確なプロセスでできることに感動し、スパコンの文脈の延長で演習テーマに決めました。

SPSS Modelerの具体的な手続きはQiitaに別途記事を残ましたので、ご興味がありましたらこちらもご覧ください。

一様分布(無作為)で正方形にダーツをN万回投げて円周率を求める(SPSS Modeler データ加工逆引き3-30)

 

 

 

実際の説明

 

まず、最初にこの問いかけをします。

「円周率(π)って何」

すると生徒さんからは「3.14!」の声が上がります。正解は「円の直径に対する円周の長さの比率」がです。

ここでNHKに叱られそうな番組のモノマネを交えてこう説明します。

円周率とは、

当然、生徒さん達はチンプンカンプンです。ただスパコンが机上でダーツを投げまくって導いた値に4倍すると正確なπが求められるという事実を先に述べてしまいます。

ここから具体的な手順を説明します。

そもそもダーツを正方形に投げるにあたり、どこかに狙って投げずに「無作為」に投げることと、その対象は1辺が2(つまり面積は4)の正方形である点を強調します。

次に狙わずに投げた結果、半径1の円の内側に入ったものは赤いマーク、外側だった場合には青いマークをつけるルールを説明します。

ダーツを投げ続けると以下のように百回や千回の頃だと、隙間が見えてデタラメに投げている感が残っていますが、1万を超えるとギッシリとマークされ赤と青の形がくっきりします。

ここで一度、ダーツが円に入る確率について考えます。デタラメに投げているのに円に入る確率は正方形の面積に占める円の面積の比率になるのでπ/4になります。

そしてその確率は、実際にダーツを投げた時の赤いマークの比率と等しくなるので

式①が成立します。あとは移行すれば(中学2年生学習済み)πを求めることができます。

式③で「スパコンが机上でダーツを投げまくって導いた値に4倍すると正確なπが求められる」の正当性について確認し、ダーツを投げる回数が多くなるほど、円周率の正確な値が判明する理屈を示します。

 

 

 

演習をふり返って

 

実際にはこのテーマが例年に比べて難解だと承知していたので、何度も周囲の大人相手に練習して臨んだのですが、中にはイマイチよく理解できないままの生徒もいたようでした。

先生方からは数式が4行続くと、思考が止まる生徒もいるので工夫の余地があるとアドバイスをいただきました。私自身も同じ年の頃にそれをされたらアレルギーが発動していたような気もします(笑)。

 

 

いかがでしたか?

 

次回は「モテる人のまばたきの回数と統計的有意差」を818日にコミュニティ限定記事として公開予定です。IBM id でログインした上JOINボタンでコミュニティ会員になってからぜひお読みください。

お楽しみに。

 

→SPSS Modelerの詳細についてはこちら

→これまでのSPSS Modelerブログ連載のバックナンバーはこちらから

→SPSS Modelerノードリファレンス(機能解説)はこちらから

→ SPSS Modeler 逆引きストリーム集(データ加工)

 

 

西牧 洋一郎

日本アイ・ビー・エム株式会社

テクノロジー事業本部 データ・AI・オートメーション事業部
Data & AI 第一テクニカルセールス

 

 

著書に「実践IBM SPSS Modeler 顧客価値を引き上げるアナリティクス」

共著書に「実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用」

0 comments
9 views

Permalink