コア科目
DSインターンシップ
授業の概要
受講生は、企業や地方公共団体等でデータ科学を業務とする部署に約2週間派遣されます。社会で活躍するデータサイエンティストの業務を実際に経験し、大学での学習・研究を社会における実務と結び付ける一助とします。海外の大学等の研究機関での研修も可能とし、その期間は1ヶ月以上と定めます。
インターンシップ終了後は報告書を提出するとともに、DSインターンシップ報告会で報告を行います。DS⁴運営委員会が合否を判定します。
授業計画(※2020年度)
- 4月
- 受講生の募集
- 5~6月
- 希望する企業・団体のアンケート調査
- 7月
- インターンシップ受入れ企業・団体決定
- 8~1月
- インターンシップ(2週間)
- 2月
- 報告会(大阪大学内)
イチオシポイント
実際に企業や官公庁へ行って、長い期間、現場の貴重なデータに触れたり業界の人たちと関わったりと、大学の中では味わうことのできない濃い体験ができます。データサイエンスに関する仕事に就きたい人におすすめです。
到達目標
DSインターンシップに参加することで、大学での学習・研究が実務にどのように活かされているかを理解し、さらに、大学で何を学んでおくべきかを再認識する。
過去の実績
2019年度は14名、2020年度は7名がインターンシップに参加しました。2020年度は新型コロナウイルス感染症のため、多くの受入先がオンラインによるインターンシップとなりました。
2月にはインターンシップ報告会を行いました(2019年度:大阪大学内、2020年度:オンライン)。発表時間は、発表7分間、質疑応答時間3分間の合計10分間とし、発表は基本的に1人ずつ行いましたが、同一インターンシップ先で同一のグループワークを行った学生については1グループ1発表としました。
受入先の業種
2019年度
- 分析系4名
- システム系3名
- 広告系3名
- 製薬2名
- 官公庁2名
2020年度
- 分析系2名
- 製薬2名
- 官公庁3名
履修についての注意事項
- プログラム「DSデータ科学」登録者が優先です。
- 定員は20名です(※2020年度)。定員を超える場合は、抽選などによって履修者を決定します。
- 他の履修科目や研究に支障が生じないこと、および指導教員の承認が必要です。
- 内容は変更になる場合があります。詳細および最新情報はシラバスをご確認ください。
実証型研究法
授業の概要
各受講生が実証的課題を持参し、データ科学の代表的なプロセスであるPPDAC (Problem → Plan → Data → Analysis → Conclusion)を教員の指導の下で進めていく実践的ゼミナール型クラスです。受講生はまず、課題と課題の意義の説明・データ採取の方法と計画・適用予定の統計分析・結果の予想など、課題解決のためのプロトコールを示します。この段階でクリティカルな指導があります。その後、受講生は中間報告1・中間報告2・最終結果プレゼンを順に行い、データ科学の実際を教員指導の下で完成させていきます。数理科学・統計学・情報科学を基盤とした学生には、方法論を分かり易く説明する演習にもなります。
受講生は、他の受講生のPPDACを疑似体験することができるとともに、分野が違うとデータ科学の在り様が全く異なることを実感することができます。こういった経験がデータ科学の幅を広げ、データ科学の本質を理解することに繋がります。
授業計画(※2020年度)
- 5/9
- 第1回①~③ グループA(10名)の発表日 (前半)
- 5/16
- 第2回④~⑥ グループA(10名)の発表日 (後半)
- 5/23
- 第1回①~③ グループB(10名)の発表日 (前半)
- 5/30
- 第2回④~⑥ グループB(10名)の発表日 (後半)
- 6/6
- 第3回⑦~⑨ グループAの発表日
- 6/20
- 第3回⑦~⑨ グループBの発表日
- 7/4
- 第4回⑩~⑫ グループAの発表日
- 7/25
- 第4回⑩~⑫ グループBの発表日
- 8/1
- 第5回⑬~⑮ グループAの発表日
- 8/8
- 第5回⑩~⑫ グループBの発表日
イチオシポイント
異なる所属・専門分野の人が集まり毎回発表を行うので、新たな知見が得られるだけでなく、自分の研究を専門外の人へ伝えるスキルも身につきます。統計学の専門家が教えてくれるので、自分の研究で用いる統計分析の手法に不安がある方にもおすすめです。
到達目標
データ科学による課題解決のために PPDAC を回せるようになる。他者の実証研究に対してデータ科学の観点から批判的レビューが出来るようになる。
過去の実績
土曜日集中型講義として、1日あたり3コマを5日間実施しました。2019年度、2020年度ともに9名の受講があり、毎日程、全ての受講者がプレゼンテーションを行いました。
最終日程では、最終報告会を行いました。1人あたり持ち時間20分間(発表15分間、質疑応答5分間)としました。
最終報告会の発表テーマ
2019年度
- Neural Network Application in Predicting Stock Returns: Evidence from Japan
- サッカー×データ分析
- 機械学習による音声シーンの分類
- 森林の測定方法の検証
- 多母集団同時分析による心理的特権意識と怒り表出の関係
- 損失の確率価値割引が公共財ゲームでの非協力に与える影響
- 健康状態と情動状態の判断に対する顔皮膚色の影響
- 没入型HMDを用いた受講者の視線傾向の獲得と分析
- 初回訪問モンテカルロ法を用いた強化学習
2020年度
- 夜間衛星写真を用いた経済発展の地理的パターンの分析 by Convolutional Neural Network
- lassoを始めとするスパース推定手法の紹介
- 社会増減率の要因分析
- リザーバコンピューティングの基礎と適用範囲の探索
- 自閉スペクトラム症児の発達軌跡に影響する要因の検討
- オタクへのステレオタイプ―コンジョイント分析による探索的検討―
- 統計的時系列モデルと機械学習の比較
- 受託試験における引合と受託の相関分析
- 重回帰分析と感度分析による筋肉活動定量化メカニズムの探索
履修についての注意事項
- プログラム「DSデータ科学」登録者が優先です。
- 定員は20名です(※2020年度)。定員を超える場合は、抽選などによって履修者を決定します。
- 内容は変更になる場合があります。詳細および最新情報はシラバスをご確認ください。
データ科学PBL
授業の概要
合宿形式で行う課題解決・演習型クラス(3泊4日)です。事前に解決すべき課題と分析データを複数セット、大学(DS⁴)側が用意いたします。数名の受講生からなるグループを作成し、グループごとに選択した課題をPPDACを回しデータ科学的に解決します。その後結果をプレゼンテーションし、批評をし合います。
合宿では、課題と関連するトピックについての講義も併せて提供されます。基本的にはグループ間のコンペスタイルですが、最後に教員が模範的な分析手順と結果・解釈、すなわちデータ科学の分析プロセスと、データ科学をすることで得られる創造的価値を示します。データ科学には入試問題のような基準解答は存在しないことが多いですが、専門家が実践する分析ストーリーの一つを定石として理解しておくことは重要です。
イチオシポイント
様々な所属・専門分野の人でグループを組み、4日間かけて共にデータを分析するため、新しい考え方や知識、チームでの動き方が身につくほか、交流関係も広がります。企業提供の貴重なデータ、教員提供のやりがいのあるデータを分析できる貴重な経験ができます。
到達目標
受講生どうしで互いに知識やスキルを吸収し、探索的な分析プロセスを身に付ける。さらに、データ科学の定石を学び、新たな課題をデータ科学的に解決できるようになる。
授業計画(※2020年度)
- 9/1
- グループによるデータ分析
事前に決定していたデータを受け取り、分析検討 - 9/2
- グループによるデータ分析
講義1、データ分析、グループ毎の中間発表 - 9/3
- グループによるデータ分析
講義2、データ分析、最終発表用意 - 9/4
- グループによる最終発表
グループ毎の最終発表及び模範分析
過去の実績
2019年度は28名、2020年度は29名が参加しました。合宿の前には事前説明会を開き、データ分析のグループ分けを行いました。合宿会場は同志社びわこリトリートセンター(2019年度)、千里阪急ホテル(2020年度)でした。
学生には、企業から提供いただいたデータ、DS4側で⽤意したデータ(7種類)の中から、グループごとに分析したいデータを選んでもらいました。
企業提供のデータは、実際に企業で分析されているデータであり、各班が、データ科学の代表的なプロセスである PPDAC (Problem → Plan → Data → Analysis →Conclusion)を学⽣の間で議論しつつ進め、最後にプレゼンテーション形式で分析内容を発表しました。
一方、後者のデータのほとんどは、それぞれに教員側からあらかじめ分析ストーリーが⽤意されていました。⼀般的な⼿法を単純に適⽤してもうまくいかない(適切でない)仕様になっており、なぜうまくいかないのか、どうすれば適切なのか、をグループごとに議論し、最後にプレゼンテーションで意見を発表しました。発表後は、狩野裕教授からの模範分析例も示されました。
時折ミニレクチャーや中間報告を挟むことで、活気ある議論ができました。また、夜には意⾒交換会が開かれ、最終⽇の夜にはバーベキューをするなど、様々なバックグラウンドを持つ受講者間での交流が⾏われました(2019年度)。
履修についての注意事項
- プログラム「DSデータ科学」登録者が優先です。
- 定員は40名です(※2020年度)。定員を超える場合は、抽選などによって履修者を決定します。
- 内容は変更になる場合があります。詳細および最新情報はシラバスをご確認ください。
データ科学各論
授業の概要
データ科学の現場における様々な分野におけるデータサイエンティストの方々に、問題設定、データの収集、データのスクリーニング、モデルの適用、データ分析及び結果の検討というPPDACサイクルを提供してもらうことによって、データ科学の様々な現場を理解し、学生の研究環境との差異を自覚し、データ科学の重要性を把握することを目的とします。
受講生は、データ科学の様々な現場におけるPPDACサイクルの流れや統計手法の運用を理解出来るようになります。
授業計画(※2020年度)
- 10/3
- 第1, 2回 イントロダクション
- 10/17
- 第3, 4回 総務省におけるデータ科学
- 10/24
- 第5, 6回 企業におけるデータ科学
- 11/7
- 第7, 8回 広告媒体におけるデータ科学
- 11/14
- 第9, 10回 経営現場におけるデータ科学
- 11/28
- 第11, 12回 受託分析事業におけるデータ科学
- 12/5
- 第13, 14回 医療現場におけるデータ科学
- 12/12
- 第15, 16回 リサーチ現場におけるデータ科学
イチオシポイント
オムニバス形式の講義であり、回ごとに異なる分野の実務家から現場のデータサイエンスを学べます。どの講師の話も面白く工夫されており、今まで知らなかった分野に興味を持つ機会を得られます。就職活動を始める(始めた)方にもおすすめです。
到達目標
データ科学の様々な現場におけるPPDACサイクルの流れや統計手法の運用を理解出来るようになる。
過去の実績
土曜日集中型講義として1日あたり2コマ、全8日間実施し、毎日程で課題が出されました。2019年度は24名、2020年度は34名の受講がありました。また、2020年度は新型コロナウイルス感染症のため、一部はオンラインあるいはオンラインと対面のハイブリッドの形で実施しました。
履修についての注意事項
- プログラム「DSデータ科学」登録者が優先です。
- 多数のゲスト講師によるオムニバス形式のため、変更がある場合があります。
- 統計検定2級程度の知識が必要です。
- 内容は変更になる場合があります。詳細および最新情報はシラバスをご確認ください。
数理特論Ⅲ
授業の概要
本講義においては、講師が一般企業においてデータ分析をビジネスに活用してきた経験をもとに、データ分析は意思決定にどう役立つのか、また、どのようにデータ分析を推進すれば意思決定に効果的に役立つのか、体系的にレクチャーします。講義はグループワークやディスカッションを中心に進められます。
授業計画(※2020年度)
- 4/14
- オリエンテーション
- 4/28
- 「見つける」ことの重要性
- 5/19
- 「解く」ことにおけるポイント、「使おうと思わせる」ことの重要性
- 6/2
- グループワーク~分析の設計~
- 6/16
- グループワーク~分析実施~
- 6/30
- グループワーク~分析結果纏め~
- 7/14
- 発表・クロージング
イチオシポイント
大阪ガスでデータ分析を行ってきた講師より、実例やグループワークを通じて、ビジネスにおけるデータ分析の進め方を学べます。分野問わず分析力を強みにしたい方、将来的にデータサイエンティストとして働きたい方におすすめです。
到達目標
実例やグループワークを通して、ビジネス課題を「見つける」力、分析課題を「解く」力、分析結果を現場に「使おうと思わせる」力が身に付く。
過去の実績
2019年度は、4日間の夏季集中講義として開講し、28名の受講がありました。講師は、小林宏樹氏、髙木大輝氏、國政秀太朗氏、手塚孔一郎氏(以上、大阪ガス株式会社)、河本薫教授(滋賀大学)でした。1日目は講義、残りの3日間はグループワークを行いました。
2020年度は、新型コロナウイルス感染症の影響により不開講となりました。
履修についての注意事項
- プログラム「DSデータ科学」登録者が優先です。
- 定員は20名です(※2020年度)。定員を超える場合は、抽選などによって履修者を決定します。
- 内容は変更になる場合があります。詳細および最新情報はシラバスをご確認ください。