アメリカ大学事情 Vol.3 2013年4月22日 アメリカから見た日本のインスティテューショナル・リサーチ その1-「学生串刺しデータファイル」に思うこと、及びSQLのすすめ。

前回そして前々回と、ムークスに関する内容の記事を載せたが、今回は視点を変えて日本の大学のインスティテューショナル・リサーチ(IR)に関連する内容にしようと思う。IRが何かとはここ数年日本の高等教育界で様々議論されてきているが、詳しくはこちらを参照されたい。

最近日本のIR関係者の中でよく聞かれるようになった業界用語に「学生串刺しデータファイル」(以下「串刺しデータ」) という言葉がある。初めてその言葉を聞いたときは、どういう意味かよくわからなかったが、よくよく聞いてみると、学生を入試から卒業、もしくは就職まで追跡したデータファイル、ということである。一人ひとりの学生に様々なデータを串刺しするように追加していくということで、串刺しデータと呼ぶそうである。いわゆる英語で言うLongitudinal Dataであるが、この学生一人ひとりを追跡する串刺しデータを作ることが近年多くの大学でIRのテーマとなっているようである。確かに、串刺しデータから得られる情報は有意義ではある。しかし、それは「データがないよりは」、という前文付きである。また、アメリカにおいてはIRが串刺しデータを軸に仕事を展開する、というわけではない。ゆえに、若干串刺しデータの話を聞くたびに、なんとなくではあるが違和感を感じていた。

まず、ここでIRの目的を再度明確にしておきたい。それは大学内にあるデータを分析して、有用な情報を抽出することである。IRの分析範囲は学生だけにとどまらない。財務分析も行うし、教員の労働分析や、授業スケジュールの効率性分析、それこそ大学に関するすべてのデータ分析の責任を負うのがIRである。とにかくデータを眺めてみて、そこから得た有用な情報を意思決定に反映させる、それがIRの根本の役割である。従って、IRに大学内の「全て」のデータをアクセスさせるようにしなければならない。そして学内のIRの存在価値はアクセスできるデータ数に比例して累乗的に増えていくといって良い。

IRに長年携わってきて思うことは、IRにとってのリサーチクエスチョン(研究・分析目的)はそれこそ無数にあり、大学組織とともに日々変化し、その移りゆく一つ一つのリサーチクエスチョンに対応させてデータ分析ファイルを作らなければならないということである。時には学生の串刺しデータが必要になる時もあれば、学生とは無関係の分析も行うこともある。いわば、日々変わりゆくリサーチクエスチョンに対して分析用ファイルを日々粛々と作成すること、それがIRの仕事の大半とも言える。実際、私も分析作業よりも分析するためのデータファイルを作成する作業のほうにより時間を費やしていることの方が多かった。

もっとも、学生の串刺しデータを作成してそれを元に分析作業を行うという作業は、現在の日本の大学の環境を考えた時、限られたリソースで行える有効な最初の一歩であるのかもしれない。それを説明するために、ここで簡単に日本のIRのここ数年の流れを振り返ってみたい。

日本の多くの大学は業務分野(例:入試、教務、人事、財務等)ごとに、業務改善の為にソフトウェアをベンダーから購入したり、もしくは大学によっては独自に開発したソフトを使用してきた。これらのソフトウェアを通して、データはそれなりに集積されていくものの、分析を第一目的にしたソフトウェアではないため、データ分析が行いやすいようにデータベースも構築されてはいないし、分析も積極的には行われて来なかった。

やがてデータに基付いた大学運営に対する関心がアメリカの影響を受けて日本の高等教育界の中でも喚起され始め、その流れの中でIRが注目を集め、徐々にIR的な機能を設置する大学が増えてきた。ところがまず多くのIRが直面した課題が、IRに分析すべきデータが集まらない、という奇妙な事態であった。データ分析の役割を担うべきIRに対して、それまでのお役所的メンタリティから抜け出せなかった各部局がデータを提供することに難色を示したという経験は多くのIR担当者が思い当たるものであろう。ある部局はデータをシェアすることを拒否もしくは無視したり、またはデータを提供することには理解を示したものの、無数の書類を提出した上でようやく必要なデータが受け取れる、というようなつれない対応が当初のIR に対する反応であった。そのような状況下では、日本の初期段階のIRは実践段階に移行することは至難の業であったといえる。

この状態を打開すべく、いくつかのイニシアチブが起こり始めた。一つはアンケートなどを通して学生調査を行い、自らIR独自のデータを集めるという展開であり、もうひとつは、各部局が保管しているデータを、IRに関係の有りそうな学生データを定期的に抽出できるようにして1箇所に集めて、それを元に分析作業を行うという方法である。いわゆる後者が上記の学生串刺しデータファイルにあたる。近年はこの串刺しデータ分析および学生調査を行うことがIRの基本業務として認知され始めてきているようである。しかし最初に述べたように、これはIRの本来の作業の一部分しかカバーできていない。

それでは今後はどうしていけばいいのであろうか。今後更にIRが学生串刺しデータファイルを軸にした作業から脱皮し、さらなる展開を行うために必要なこと、それは単純すぎるのかもしれないが、IR担当者がSQLのスキルを持つことである。SQLはデータベース言語のことを指すが、現時点の日本のIRの発展を妨げている一つの理由、それは大多数のIRスタッフがSQLの知識を持ち合わせていないことに起因している。IRスタッフがSQLを知らないが故に、誰かにフラットファイルにデータをいちいち用意してもらってそれに基づいてエクセル・SPSSで分析作業を行わざるをえなくなっている、要するにIRの生産性が低く、そこに日本のIRの停滞の一因がある。

大学に現存するデータ量はとにかく膨大であり、何百、もしくはそれ以上のテーブルが存在する。従って、それを誰かに頼んでいちいちフラットファイルにデータを落としてもらってそこから分析を行うことは時間が掛かるし非効率である。SQL言語を理解すれば、誰かに頼んでフラットファイルにデータを落としてもらう必要がなくなり、IRが分析をデータベースソフトウェアを通じて行えるようになる。MSアクセスであっても、MS SQLでも、MySQLでも、オラクルでもなんでもいい。とにかく日本のIR担当者はSQLを学び、それをもとに分析するスキルを身に着けていくことが急務である。

SQLを学ぶメリットは膨大なデータを簡単に扱えるということだけではない。SQLを学べばおそらくIR担当者は組織の縛りを飛び越えられる可能性も上がる。現時点では、多くの大学が、各部局のデータ担当者から、部局の所有するデータベースから抽出されたデータをCSVファイルで受け取り、そうして集まったファイルをIT担当者が組み合わせて串刺しデータを作り、IRがそれを受け取ってデータ分析を行う。いわば、ひとつの分析を行うまでに、複数人の手を経ている。これでは非効率であるし、ファイル作成過程でエラーが出やすい。

IR担当者がSQLを理解すれば、この中間の役割を担う人たちの作業が不必要になる。IRが自らのPCにSQLのソフトウェアをインストールして、そこから、ODBC(Open Database Connectivity)ツールを用いて、直接各部局のデータベースに読み取り専用で直接アクセスできるようにしてしまえばいい(もちろんそれなりのセキュリティを確保した上であるが)。そうすると、IR担当者は、各部局にあるデータベースの中にあるテーブルを全て閲覧できるようになる。そして、必要に応じて各データベースからSQLに必要なデータを自分のPCにインストールされたSQLソフトウェアに取り込み、SQLを駆使して分析を行う。アメリカではこのようにSQLを中心に分析作業を行えるIRが最も重宝されているということは意外と知られていない。

IRは高等教育研究者と違って、一つのデータ分析に時間をかけることができない。いかに素早く、多領域に渡る一つ一つの分析を数多く効率よくこなしていくかが鍵である。それが故に、誰かにデータを用意してもらうのでは仕事にならないので、自らデータを手に入れて、分析用のファイルを素早く作るスキルを持つ必要がある。私も、過去IRスタッフを採用した時、新しく入ったスタッフには何よりも最初にSQLをとにかく最初に教えてきた。SQLを知ると知らないとでは、作業の効率性は雲泥の差であるからである。日本のIR担当者もいち早く、SQLを学ぶことを薦めたい。知っていて決して損することのないスキルであると思う。