计算机毕业设计之基于决策树的饮品推荐系统的设计与实现

计算机毕业设计之基于决策树的饮品推荐系统的设计与实现
本文介绍了基于决策树的饮品推荐系统的设计与实现。该系统采用了Python编程语言、MySQL数据库以及Hadoop、Spark等大数据技术实现了根据用户特征进行个性化饮品推荐的功能。系统采用可视化Web界面首先通过收集和存储饮品的相关资料包括饮品购买的品种、购买人的年龄、性别、职位和季节等特征信息然后使用Pandas进行初步的数据处理和存储最后通过Hadoop分布式文件系统将数据传输至MySQL数据库管理系统。核心的分布式计算部分利用了Spark的强大处理能力进行特征工程和决策树机器学习算法的训练完成饮品推荐的功能。系统的科室会界面是通过Django和Vue.js框架将推荐结果呈现给用户。该系统的意义在于能够根据用户的特征进行个性化饮品推荐提高了饮品的销售量且具有较高的实用性和扩展性方便继续优化系统性能提高推荐效果为饮品销售提供更好的服务。系统的功能主要包括三个方面。首先是需要准备相关的数据这些数据包括有饮品分类信息饮品信息等。其次是将这些数据通过hadoop的HDFS组件存储到服务器的mysql中通过pyspark对数据进行分布式计算处理。最后通过django搭建的web页面进行数据的可视化展示在页面中也需要完成饮品推荐功能推荐的方式主要是通过用户点击的饮品根据用户的年龄、性别、当时的季节等特征来完成推荐相关的饮品。系统主要模块设计根据以上的功能需求情况整体的功能模块包括有前台vue项目模块后台django后台项目模块和数据处理模块。前台vue的页面主要页面包括注册与登录页面数据可视化展示页面数据处理模块主要用来对饮品的相关数据进行清洗的通过使用hadoop进行数据的存储django后台用来提供前台所用的json数据以及给出推荐的相关的饮品信息。其中饮品推荐模块的实现是基于机器学习功能之后的应用阶段。用户进入本系统可查看系统主页信息可视化主页面展示分为7块区域顶部是系统的名称下面划分为6个区域,上部分3个区域主要是饮品类别统计区域饮品信息列表展示区域饮品销售排行区域下部分3个区域分别饮品购买趋势展示区域、饮品推荐区域和饮品购买性别展示区域具体如图。主页中的图标数据主要是通过Echart框架的功能只需要创建对应的实体类变可以获取对应的展示信息。