【特別講義】新科目「情報Ⅰ」の攻略法 第2回『データの活用』(実践編)

【特別講義】新科目「情報Ⅰ」の攻略法 第2回『データの活用』(実践編)

2023年 04月 28日

 第2回のテーマは「データの活用」です。データは,情報の元となるとても大切なもので,もちろん共通テスト「情報Ⅰ」でもデータについて出題されます。

 実践編の今回は,共通テスト対策はもちろん普段の授業にも役立つ,データの活用が得意になる方法について,情報科教諭の岡野先生に語っていただきます。

 

Q1.データの活用が得意になりたいです。まず何をすればよいですか?

 データの活用が得意になるためには,まずゴール(分析結果)までの道筋をイメージすることがとても大切です。

 ・何を明らかにすることが目的なのか。

 ・自分は今どんな仮説(考え)を持っているのか。

 ・仮説を検証するために,どんなデータを集める必要があるのか。

 ・集めたデータをどんな方法で分析すれば,仮説を検証できそうか。

など,順序立てて考えてみましょう。

 そしてデータを用意しても,すぐに分析が開始できるとは限りません。自分の目的に合わせて分析方法を選ぶことも必要です。

 高校「情報Ⅰ」の授業でメインとなる分析は主に以下の2パターンです。

 ・相関分析と回帰分析

 ・仮説検定(t検定)

 2種類のデータの「関係性」に着目して,そこから仮説について予想を立てたいのであれば,相関分析と回帰分析を使います。

 回帰分析では2種類のデータについて,論理的にみて,原因と結果とみなせるような状態になっていることが必要です。

 

 ここで注意が必要なのは,「相関関係」と「因果関係」は必ずしもイコールではない,ということです。次の図を見てみましょう。

 (データの出典:総務省統計局『家計調査(家計収支編) 時系列データ(二人以上の世帯) 1. 品目分類:支出金額』)

 

 このように,相関がある2つのデータの間に一見因果関係があるかのように見えても,実際には交絡因子という第3の要素が共通の原因となっていることがあります(これを専門用語で「疑似相関」と呼びます)。

 実際にデータを集めて分析する際には,こうした疑似相関などにも注意しつつ,データ間の因果関係を想像しながら行うことが必要になります。

 

 また,2種類のデータの「差」について統計学的に分析したければ,仮説検定(t検定)を行うと良いでしょう。

 仮説検定に用いるデータは,高校までの学習内容に沿って正確に言えば正規分布に則ったデータであることが求められます。ただ,仮説検定の学習は,まずは一通りの流れを知るために正規分布ではないデータを用いてもよいと私は考えています。まずは分析の仕方を学習したあとで理解を修正していきましょう。

※もちろん正規分布でないデータでも仮説検定は可能です。実際にコンクールに出すようなレベルの論文などを書きたい場合は,「仮説検定 種類」などと検索してそれに沿って分析してみましょう。

 

Q2.データの活用の学習は,具体的にどのように進めればよいですか?

 データの活用を学習する際は、まずは一通りの分析の流れを表計算ソフトを活用して実際にやってみることをおすすめします。今回は試験に出やすい相関分析・回帰分析を例にとります。

 ① データを集める

 最初の学習に使うデータは自分の興味関心が持続しやすいものを選んだ方がよいでしょう。たとえばスポーツが好きな人なら,プロ野球やJリーグのデータを分析してみるというのはどうでしょうか。NPB(日本野球機構)のページにはプロ野球チームのデータが揃っています。Jリーグでも同様に,チームのデータを紹介しているページがいくつもあります。

 ② 実際に分析してみる

 データを用意できたら,早速表計算ソフトを使って分析してみましょう。

 相関分析・回帰分析であれば,最大値,中央値,平均値,最小値,四分位数などを求め,それをヒストグラムにしたり,相関係数を出して回帰直線を引き,その式に値をいれて推定値を求めたりしていきます。

 数学の「データの分析」ではこうした値を求めること自体が目的なので,計算も自分ですることが多いですが,情報Ⅰの「データの活用」で大事なのは,求めた値から何を読み取り,考えるかなので,表計算ソフトなど便利なツールは積極的に使っていきましょう。

 ③ 分析結果から考察してみる

 野球であればチームホームラン数とチームヒット数のどちらが勝利に関係してくるか,Jリーグであればショートパスを多用するチームとロングパスを多用するチームのどちらがより勝利と関係してくるか,などを考察すれば,贔屓のチームがなぜ強いのか,またなぜ弱いのかなどといったことについて新しい視点を持てるようになり,より楽しく勉強できるはずです。

 スポーツ以外が趣味の人も,映画の興行収入やCDの売り上げ,テレビ番組の視聴率など,自分がより深く知りたいと思う分野のデータを探してきて分析・考察してみると楽しいと思います。この際,論理的な原因と結果をイメージしながらデータを集めてください。

 このように実際のデータを元に数字からグラフが形作られたり,変化したりするのを見て,そこから考察するという過程を一通り経験した後に,改めて理論を学ぶ方が,データについての理解は進みやすいものです。

 私の授業でも,一通り実際に分析を行ってみて流れを掴んでから,教科書や参考書に戻って理論を説明した方が,生徒の理解が進みやすい印象です。

 まずは全体を経験してから,細かい理論や知識を埋めていきましょう

 データの活用について,自分で本を買って詳しく勉強したいという人には,『First Book 統計学がわかる』(技術評論社)などがわかりやすくおすすめです。

 

Q3.データの活用の分野で,より応用力をつけるにはどうすればよいですか?

 現在多くの学校で「総合的な探究」の時間が設けられており,探究活動が行われています。その探究活動に,「データの活用」で学んだことを取り入れて使ってみてはいかがでしょうか。自分が集めてきたデータを分析して集計することでより理解が深まり,探究の手助けにもなります。多くの学校では高校1年生の時に情報を学んでいると思います。全国の情報の先生方は高校1年生の情報で学んだ内容を高校2年生の時の「総合的な探究」の時に実践として使っていくことを強く求め,そして願っています。

 学校の探究課題でデータが必要なら,まずは総務省統計局のホームページ(https://www.stat.go.jp/)などを確認してみるとよいでしょう。ここには日本の人口,労働,経済,金融など様々な社会的データが揃っています(Q1で例として示したアイスとビールの家計支出金額も、ここで公開されているデータを使いました)。

 他にも,検索エンジンで「〇〇〇 オープンデータ」などと検索して,データが公開されているものを探して使うという手段もあります。

 ただ,世の中で既に分析されつくしたような情報を集めても,オリジナリティがないと先生から言われてしまいますので,ぜひ自分で分析し,自身の探究の独自性を打ち出していきましょう。

 この方法は授業の評価だけではなく,大学入試の総合型選抜の面接などで話せる話題として大いに役立ちますし,もちろん共通テスト「情報Ⅰ」で出題されるデータの活用の分野でも,大きなアドバンテージを得ることができると思います。

 

 将来の受験生に向けて,応援メッセージをお願いいたします。

 この分野は共通テストでただ単に点数をとるためだけではなく,将来必要なスキルや考え方を学べる内容になっています。実際にデータの活用は企業側から求められて実際に学習指導要領として入ってきています。将来,仕事に就く時のスキルを得るためにも,今勉強を頑張っていきましょう。

 


 実際に自分でデータを集めて分析してみることで、データに親しみつつ、得意になることができるのですね。

 岡野先生,ありがとうございました!

 前回の『データの活用(基本編)』はこちら

 

 

岡野 英樹(おかの・ひでき)

 

佼成学園中学校・高等学校の情報科教諭。実教出版情報教科書「情報Ⅰ Python」「情報Ⅰ JavaScript」指導用教科書を執筆。

授業研究「情報Iを見据えたプログラミング教育~学習者の独自設計を可能にさせたミニチュア配膳ロボットのプログラミング教材の開発と実践と評価~」で令和4年公益財団法人東京都私学財団賞を受賞。慶應義塾大学院政策・メディア研究科修了。

「情報Ⅰ」はどうしてもスキルによって進度の差が出てしまう教科なので,課題設定を工夫しすべての生徒に飽きさせない授業設計を心掛けている。