# pythoncode **Repository Path**: thinker2002/pythoncode ## Basic Information - **Project Name**: pythoncode - **Description**: Python - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-04-14 - **Last Updated**: 2022-04-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: Spider, 数据分析 ## README # pythoncode #### 介绍 本项目利用简单的爬虫技术,爬取安徽工业大学往年在各省市的最低分数线,并将获取的数据 利用数据分析和数据可视化制成了单一的折线图 #### 环境配置 Python 3.9 Pycharm社区版 以下是所需要的模块,数据分析:pandas matplotlib numpy 爬虫:requests BeautifulSoup #### 使用说明 data newdata graph 文件夹下都是分文件存储的 1. data 文件夹下保存的是爬虫提取的数据 2. newdata 文件夹下保存的是数据分析之后保存的数据 3. graph 文件夹下保存的是数据可视化之后制成的图表 #### 出现的问题 1. 在 数据分析图表.py 文件中有警告:UserWarning: Glyph 8722 (\N{MINUS SIGN}) missing from current font. 2. 在 graph 文件夹下的 新疆.png 图表中x轴的坐标没有正常显示(猜测是在 x = df['年份'] 列表中只有两个值,没有细分x轴 的刻度值导致的,大家可以试一下给特定的坐标刻度值) 3. 没有工程文件的结构,只能单独运行一个文件,三个.py文件都是独立的: 爬取.py——>数据分析.py——>数据分析图表.py #### 改进建议 data.csv文件中包含所有数据,我不会处理,主要是还要分割成多个dataframe格式的数据,根据地点名来分辨每个dataframe,可以尝试一次性处理所有数据