講演1:欧州のRDM最前線:ライデン大学の取り組みに学ぶ

オープンデータが研究活動に与える影響を分析する研究を行うとともに、オランダ・ライデン大学でデータスチュワード制度の運用実態を実地で学び、理解を深めた。現在は京都大学附属図書館にて、オープンサイエンスや研究データ利活用に関する研究および電子出版推進業務に従事。
セッション概要
| 主催: | 株式会社早稲田大学アカデミックソリューション |
| 登壇者: | 沼尻 保奈美 氏(京都大学附属図書館 研究開発室 助教) 角南 直幸 氏(アイントホーフェン工科大学 データスチュワード) |
| 司会: | 渡邉 里菜(早稲田大学アカデミックソリューション) |
| 趣旨説明: | 金丸 淳(早稲田大学アカデミックソリューション) |
近年、公的研究資金制度においてデータマネジメントプラン(DMP)の策定が求められるようになり、日本国内で研究データ管理体制の整備が急務となっています。
とはいえ、日本では専門職の導入や支援体制の整備が十分に進んでいないという現状があります。この喫緊の課題に対し、本セッションは、欧州、特にオランダの先進的な知見を提供することを目的として開催いたしました。ライデン大学の先進的な事例からRDM推進の枠組みとポリシーのあり方を学び、さらに、アイントホーフェン工科大学の現役データスチュワードである角南 直幸氏から、その経験に基づく実践的なサポートの現状と課題を直接聞くという、大変貴重な機会となりました 。
データスチュワードの角南 直幸氏には、このセッションのためにオランダから日本にお越しいただきました。角南氏とご所属のアイントホーフェン工科大学に、心より御礼申し上げます。
また、今回のセッションの開催にあたりましては、もうお一人のご登壇者である沼尻 保奈美氏、そして政策研究大学院大学の林 隆之氏、早稲田大学の丸山 浩平氏にご協力いただきました。深く御礼申し上げます。ありがとうございました。
本レポートでは、欧州のRDM最前線の詳細な報告と、日本に適したRDM推進モデル構築の可能性を探ったディスカッションの模様を報告します。

私は、GRIPSの博士課程在籍時(2022年)、JSTのプログラム(2023年)と、二度にわたりオランダのライデン大学科学技術イノベーション研究センター(CWTS)へ客員研究員として滞在いたしました。この機会に、データスチュワードの方々とネットワークができました。2023年の滞在時には、GRIPSのセミナーでCWTSのデータスチュワードであるAndreea-Maria Hofmann氏らをお招きし、「データスチュワード:オープンサイエンスにおける新たな専門職の役割」と題したセミナーを開催いたしました。この際に、「日本ではデータスチュワードは『ファンタジー』のような存在。ご本人を紹介できて嬉しい」と申し上げたところ大変喜ばれましたが、そういった点で、今回も貴重な機会になると考えています。
欧州におけるオープンサイエンスの潮流
欧州では、オープンサイエンスを推進する上で、ユネスコが2021年に制定した定義が基本的な指針となっています。この定義は、「研究にかかるデータや結果は共有し、多言語の科学的知識を誰もが自由に利用・アクセス・再利用できるようにする」ことを目的とした包括的な概念です。オープンサイエンスの要素は多岐にわたり、「Open Scientific Knowledge」(その中にOpen Dataが含まれる)、「Open Science Infrastructures」、「Open Engagement of Social Actors」、「Open Dialogue with other Knowledge Systems」の4つの概念に基づき推進されています。
―沼尻氏のスライドより―
オープンデータは、オープンサイエンス運動の「オープンアクセス」と並ぶ中核的な要素であり、「研究で生成されたデータに対する制限のないアクセス、利用、変更、再配布」を指します。データはただ公開されるだけでなく、引用され「再利用」され、新たな研究が生まれる基盤となることで、費用便益の高い「研究資産」として認識されます。
EUにおける最近の具体的な取り組みとして「OS-TREILs」があります。これは「Scientific Knowledge Graph (SKG)」「FAIR assessment」「Data Management Plans (DMPs)」を3つの柱としています。 特に注目されるのが「maDMP(Machine-Actionable DMP)」、すなわち機械判読可能なDMPです。これは、DMPを機械判読可能な状態で公開し、データ、ソフトウェア、資金、プロジェクトといった研究を管理する全ての実体(エンティティ)にリンクさせることを目指す取り組みです。
オランダにおけるRDM推進体制
オランダでは、2016年にオランダ科学研究機構(NWO)が研究データ管理ポリシーを制定しました。これにより、NWOに助成を申請する際にはDMPの策定が義務化されました。このポリシーの目的は、NWOの資金提供によって生成された研究データが、可能な限りオープンでFAIR(Findable, Accessible, Interoperable, Reusable)であることを確保し、影響を最大化することです。さらに、これらの取り組みに関し、2023年には分析が行われ、モニタリングまでできている状況にあるといえます。
こうしたRDM推進の担い手として、「データスチュワード」の役割が欧州で注目されています。例えば、英国の研究所からは「研究者100人に対し5人」(Nature, 2017)、EU全体では2万人規模のデータスチュワードが必要という少し驚くべき提言もなされています。
ライデン大学のデータスチュワードシップ
ライデン大学では、2016年にRDM方針を採択し、「研究データ管理文化の形成」を推進しています。
データスチュワードは、ファカルティ(学部・研究科)ごとに1人ずつ配置されており、研究データの収集・管理・保存・公開の各段階で研究者を支援する役割を担っています。研究者がDMPを作成する際、データスチュワードが「First Point of Contact(最初の相談窓口)」となり支援を行う体制がとられています。
「研究データを安全かつ倫理的、持続的に扱う方法を助言し、研究データ管理文化の改善を現場レベルで推進する」
こちらは、ライデン大学の社会科学部・行動科学部のデータスチュワードの募集要項です。このことからも「研究データ管理文化」を確立させようという大学側の強い思いが見受けられます。

私がデータスチュワードをしている原動力は、フィリピンの大学時代の2つの思いが原点になっていると思います。心理学を専攻していた当時、大学が契約していたのは看護学系ジャーナルのみで、読みたい論文に全くアクセスできませんでした 。しかし、インターネットで検索すると、研究者自身が(契約上はグレーかもしれないが)Webサイトで公開している論文PDFを見つけることができました。この経験から、二つの強い思いを抱きました。一つ目は「オープンデータの力強さ」。オープンになったデータに後押しされ、「研究がしたい」と強く思うことができました。二つ目は「不平等への憤り」です。先進国ではアクセスできる情報に、フィリピンではアクセスできないという強いフラストレーションを感じました。この「オープンサイエンスの力」と「不平等への憤り」こそが、社会心理学で博士号(PhD)を取得した後、オランダでデータスチュワードとして研究者を支援する現在のキャリアの原動力となっていると思います 。
データスチュワードシップが生み出すもの
データスチュワード、あるいはデータスチュワードシップが不在の場合、プロジェクト終了後の研究データは深刻な問題を抱えることになります。最大の問題は、「データロス(消失)」の危険性です。研究プロジェクトでは、データを収集・分析して論文が出版されると、そこで一区切りとなりがちです。しかし、その根拠となったデータ自体は、論文出版後に忘れ去られてしまうケースが少なくありません。プロジェクトが終わり、研究者の関心が次のテーマに移ると、データは管理されなくなり、最悪の場合は失われてしまいます。これは貴重な研究成果の「浪費」につながる危険な状態です。
―角南氏のスライドより―
これに対し、データスチュワードシップは、研究データを「ライフサイクル」で捉える視点を提供します 。データが「計画(Plan)」され、「収集(Collect)」「処理・分析(Process/Analyse)」され、「出版(Publish)」された後も、「保存・共有・再利用(Preserve/Share/Reuse)」され、次の新しい研究の「計画」に繋がっていく──この循環を生み出すことが重要です。この活動の根本には、「データはみんなの財産である」という思想があり、公共の研究機関としてデータを適切に管理する責任があります。そして、こうしたことは2007年頃から言われてきたことですが、まだまだやるべきことが多くあると感じています。
2013年オランダ政府が「論文の100%をオープンアクセスにする」という目標を掲げました。これでオープンサイエンスに対する活気が一気に高まりました。次に2014年、「FAIR原則」がライデンで草稿され、オープンアクセス(論文)からデータへと関心が移ってきました。2015年には「デン・ハーグ宣言」が出され、「データは誰でも平等にアクセスされるべき」ということが宣言されました。このように、論文のオープン化(オープンアクセス)をしようという気風から、研究データについて焦点が当たってきたということです。そして、2016年に、NWO(オランダ科学研究機構)において、DMP(データマネジメントプラン)の提出がプロジェクト開始前に義務化されました。2017年~2018年にかけては、「デジタル化推進補助金」といったものが各大学に支給され、データスチュワードの雇用が積極的に行われるようになります。
オランダのポリシーやオープンサイエンスへの動きは、EUとの相乗効果もあると思っています。EU委員会は、2019年「データ管理計画(DMP)は必須」であり、「研究支出の平均5%がデータの適切な管理と運用に使われるべきだ」という指針を出しています。
アイントホーフェン工科大学のデータスチュワードチームは7名で約3,400人の研究者をサポートしており、中央の図書館・情報サービスに所属しています。
主な業務は、DMP作成のアドバイスです。DMPは「流動的な文書(Living document)」として、研究の進行に伴い随時アップデートが推奨されます。当大学では今年より全ての研究プロジェクト(PhD学生の研究等も含む)でDMPが必須となっています。随時アップデートされた流動的であることが、重要な点であると考えています。
データスチュワードはDMPを代筆するわけではありませんが、研究者と一緒に作成をサポートします。DMPの提出とレビューには「Research Cockpit」というプラットフォームが共同開発され利用されています。
データスチュワードが提供するアドバイスは、「コンプライアンス・法的アドバイス」(GDPR、データ契約書、倫理委員会関連)と「FAIR&オープンデータ」(研究革新)の2種類に大別されます。ただし、オランダ国内であっても、データスチュワードの業務内容は大学によって様々であるようです。
ここで実際に、「FAIRデータとは一体何か」について、少しご説明したいと思います。
FAIRデータとは、F・A・I・R、それぞれの頭文字を取っています。
1つ目、F=Findable(見つけられる)データに関して言えば、リポジトリに登録されているか、インターネットの検索で見つかるか、ということです。
2つ目、A=Accessible(アクセスできる)データでいうと、データがダウンロードできるかどうか。
3つ目、I=Interoperable(相互運用できる)これは少し難しいですが、テクニカルな話です。一つのフォーマットのデータが、他の環境(他のソフトウェアなど)で読み込めるかどうか、ということです。
最後、R=Reusable(再利用できる)そのデータを使って、新しい研究や新しい知見を作れるかどうか、ということです。
家を例えに使って、説明することがあります。
まずは、Findable;住所録や電話帳で、家の住所や電話番号が見つけられるか、ということです。「見つけられる」だけです。
つぎに、Accessible;家を見つけられて、そこに行って、ドアを開けて中に入れるかどうか。
そして、Interoperable;日本の家に入って電化製品を使おうと思った時、そこにあるコンセントはヨーロッパのプラグ(形状)だった。これはで相互運用できません。
最後に、Reusable;家が見つけられ、家に入れて、電化製品が使えて、そこで新しい人生が歩めるかどうか。
もう一つ、オープンデータとFAIRデータの違いです。オープンデータというのは、主に「見つけられて、ダウンロードできるか(Findable,Accessible)」というところに焦点が当たっていると思います。しかし、FAIRデータはそれ以上、F・A・I・Rの全てを網羅しています。もう一つ面白いのが、FAIRデータは「みんながアクセスできる」わけではない、ということです。機微情報や個人情報が入っているデータであっても、FAIRにすることは可能です(※アクセス権限を管理する、など)。
今日覚えていただきたいのは、「FAIRは必ずしもOpenではない」ということです。
もちろん、アイントホーフェンでやっているデータスチュワードシップのサポートは、完璧なわけではありません。課題もあります。現場の課題として以下のようなことがあげられるのではないかと考えています。
1.データスチュワードサービスの周知不足
サービスの周知はなかなか難しいです。大学内のコミュニケーションルートが確立されていない面もあります。
2.専門領域に特化したアドバイスの難しさ
データ管理の一般論は大丈夫ですが、分野に特化したオントロジーやメタデータ・スタンダードに関するアドバイスは、難しい側面があります。
3.業務のバランス
どちらかというと、コンプライアンス活動が優先され、FAIR化などの革新活動とのバランスが取りにくいことが課題です。それらが必須のものだからです。FAIRデータや新しいメタデータについて考える時間は少し後回しになってしまいます。
4.教育体系
教育体系は確立途中といえます。体系化されたものとしては、ユトレヒト大学のコース(これはOJT(実地研修)です)や、オランダの研究データ管理機関(RDNL)の「Essentials4DataSupport」というコースがあります。データスチュワードに興味がある方はぜひチェックしてください。
教育体系ということで言えば、ピア・ラーニング(仲間同士の学び合い)が大切だと思います。そのためにはコミュニティが必要です。オランダには「DSCC-NL(DutchDataStewardshipCompetenceCenter)」という非常に大きなコミュニティがあり、オランダ国外からの参加もOKです。参加してみてください。もう一つ、コミュニティ関係で申し上げたいのが「オープンサイエンス・コミュニティ」です。オランダや欧州、アフリカ、最近では日本でも立ち上がってきていますが、オープンサイエンスに興味がある人が集まる場を作り、皆でオープンサイエンスについて考えていく活動です。私もアイントホーフェンのミートアップでお話しさせていただいたりします。日本でもこういうことができるのかな、と思ったりしています。
確かに、日本に「データスチュワード」という専門職があれば、周知しやすい側面もあるかもしれません、しかし、現状、日本のDMPは提出時のチェック等が必須ではないように見受けられ、その必要性がどのように認識されるのか、少し気になります。また、被験者のプライバシーや個人情報保護に関して、誰がサポートされているのかも気になりました。
そして、これはもっと大きなテーマですが、データスチュワードシップやオープンサイエンスは、非常に良いアイデアであり、盛り上げていきたいと思っています。しかし近年、特にオランダでは、オープンサイエンスが政府や大学から「やらなければいけない(Requirement)」、必須である、というものになってきています。しかし、忘れてはならないのは、これは元々、研究者コミュニティが「お互いに、これは良いことなのだ」と同意して作っていったポリシーだと思うのです。ずっとそうあってほしい、ボトムアップ、草の根(Grassroots)の部分であってほしいと思っています。日本はどうでしょうか?
確かに先行事例(ヨーロッパ)から学べる教訓は多々あります。しかし、グローバルな視点で見た時、日本は先進国だと思います。色々なことができるのではないかと、考えるとすごくワクワクします。RDM関係では、まだ「グリーンフィールド」ではないかと。データ(基盤)もまだなく、体制も確立されていないからこそできるRDM支援の形があるのではないか、と思っています。
以上で終わらせていただきます。ありがとうございました。
商品についてや弊社についてなど、こちらより
お気軽にお問い合わせいただけます。
※著作権処理代行に関するお問い合わせは、
以下のフォームよりお願いいたします。
著作権処理代行お問い合わせフォーム
