diff --git a/README.md b/README.md index 03480d59e2ab0fe496a686badffe4f8fe655591e..c81e7a963cdba5bfcdc8679b25ccafed278f998c 100644 --- a/README.md +++ b/README.md @@ -5,8 +5,6 @@ # 基于世界教育现状设想优质教育发展 ## 项目一:爬取联合国教科文组织公众号 -> (数据加值宣言:本项目产出按XXX及XXX挖掘的关于YYY(例子: NPS)工作的数据,以解决NPS就业需求及特性的就业分析问题) -> 注. 需达成评价表格PRD1.考核内容:"作者成功地把数据产品对加值(总结解决什么问题)的精确丶专业及中肯地总结表述于第一段" * 挖取关于联合国教科文组织公众号中,以教育、性别、战争、联合国为关键词的文章,并生成excel表格。有标题、发布时间、分类等基本信息。 - 数据加值: 得到联合国教科文组织公众号中“教育”“性别”“战争”等文章的相关信息,助我们具体地了解联合国对于教育、性别不平等相关文章的信息。 @@ -31,7 +29,7 @@ 4. [然后用将上一步的爬取的文章信息爬取形成excel表格](https://gitee.com/web_data_mining_group/Web_Mining/blob/master/data_result/%E5%85%AC%E4%BC%97%E5%8F%B7_url_%E8%81%94%E5%90%88%E5%9B%BD%E6%95%99%E7%A7%91%E6%96%87%E7%BB%84%E7%BB%87.xlsx) -## 项目二:爬取联合国数据库 +## 项目二:[爬取联合国数据库](http://data.un.org/Search.aspx?q=education) * 挖取关于联合国教科文组织公众号中,以教育、性别、战争、联合国为关键词,并生成excel表格。有标题、发布时间、分类等基本信息。 @@ -56,7 +54,7 @@ Query参数包括: 3. [先是用Selenium自动框架爬取联合国数据库相关数据集](https://gitee.com/web_data_mining_group/Web_Mining/blob/master/%E8%81%94%E5%90%88%E5%9B%BD%E6%95%B0%E6%8D%AE%E5%BA%93_%E5%85%A8%E7%90%83%E6%95%99%E8%82%B2%E6%95%B0%E6%8D%AE%E4%B8%8B%E8%BD%BD01.ipynb) 4. [然后用将上一步的爬取的数据集进行数据分析](https://gitee.com/web_data_mining_group/Web_Mining/blob/master/%E6%8C%96%E6%8E%98%E4%BB%A3%E7%A0%81%E5%8F%8A%E7%BB%93%E6%9E%9C.zip) -## 项目三:爬取联合国新闻网站 +## 项目三:[爬取联合国新闻网站](https://news.un.org/zh/) - 数据加值: 本项目以印度为关键词,旨在爬取联合国新闻中关于印度的相关新闻,聚焦印度教育,从印度映射到世界,推断教育发展不平衡的原因,并对联合国后续如何提高优质教育提出设想。