项目思路

Ⅰ 项目设计

· 根据电影票房市场的发展和变化,对项目进行了规划
· 探寻了国内外多个票房数据网站,最终选定以Box Office Mojo网站和豆瓣电影的数据作为基本数据支撑,并根据总规划确定了数据的收集目标
· 进行了数据库和数据结构的详细设计

Ⅱ 数据收集和整理

· 利用爬虫技术批量获得2000年至2024年6月全球票房年度前200部电影的数据
· 爬虫初期被网络服务器反爬虫,遂优化爬虫技术,设置时间间隔,使数据收集顺利进行
· 用Jsoup库对数据进行清理,并储存于数据库

Ⅲ 数据分析和可视化

· 从时间和空间的维度
· 利用总和、标准差两个数据来评估不同时期、不同国家/地区的票房情况
· 最终利用echarts中的饼图和折线图来可视化呈现

Ⅳ 网页设计和展示

· 将爬取的详细数据通过网页的表格和弹窗形式层层展示
· 将图表内容通过网页的动效展示
· 细致打磨网页设计的细节,反复调整html,css,js等各类文件,使呈现效果最佳

全球年度总票房排行榜一览

(点击排行榜中的电影查看详情)


电影票房搜索

(点击搜索结果中的电影查看详情)



数据分析图表展示

Ⅰ 各年度全球票房前200名电影类型占比饼状图



_





Ⅱ 各年度全球票房前200名电影国家/地区票房占比饼状图



_





Ⅱ 各年度全球票房前200名电影总票房及其标准差折线图