大数据云平台(学院商务大数据云平台软件开发)项目概况 为顺应新文科理念下工商管理类人才培养要求,学院工商管理学院各专业进行新文科改造,需要建设商务大数据云平台,以满足工商管理、市场营销、电子商务等各专业实践教学课程和教研科研需要,为此需采购以下设备设施。 学院商务大数据云平台软件开发总体要求 通过本项目建设,引入企业级双引擎商科大数据平台,既支持编程式大数据实验,又支持图形式大数据实验,让学生具有数据思维意识,掌了解大数据工具,学会运用工具挖掘、分析大数据,锻炼应用实践能力。 本项目要求中标人满足各项技术指标要求,系统安全稳定,管理维护简单,售后服务优良。四、需求 序号 货物名称 技术参数及要求数量 单位 所属行业 1hr综合管理 平台为CS架构,其功能包含课程管理、班级管理、教学(测 1套 软件和信 序号 货物名称 技术参数及要求数量 单位 所属行业 平台 试、问答等)管理、科研管理等内容如下: 息技术服务业 1。平台客户端和服务端可以部署在不同的物理服务器之上。 2。服务端须运行在主流linux操作系统之下,包括CentOS、Re dHat等。 3。客户端软件可以运行在windows操作系统之下,包括window s7以上版本。 4。平台支持三类用户:管理员、教师和学生,分别有不同的权 限。 5。管理员可以添加新课程,支持个性化设置课程封面图片、课 程名称,描述,作者等,支持编辑课程的教学目录结构,设置 章和节。 6。支持图文混排格式的电子教材,支持文档目录结构。 7。支持不同类型的课件,包括教案PPT,PDF,视频课件。支持 添加不同类型的实验资源包,实验资源支持图文混排的实验指 导书,实验建议时长(课时),实验数据,示例模型(程序代码 数据工作流)等。 8。支持docx格式的教材和实验指导书上传,以及线编辑。 9。支持通过课程编号、课程名称、课程描述、作者、联系方式 等进行快速检索课程。 10。支持xlsx文件格式批量导入教师用户、学生用户,也可以 单个添加教师学生用户。 11。支持通过工号、姓名、性别、职称、联系方式快速检索教师 用户。 12。支持通过学号、姓名、性别、年级、联系方式对学生用户进 行快速检索。支持教师和学生帐号的院系和班级设置。支持班 级和课程的关联。 13。支持每门课程实验所需数据的统一配置和管理。支持教师播 序号 货物名称 技术参数及要求数量 单位 所属行业 放ppt教案,允许设置学生客户端是否同步播放。 支持实验过程中实验指导书的查看及隐藏以方便实验。 每个用户(教师学生)分配有独立的数据湖存储空间,支持私有数据湖的数据下载、移动、重命名、删除等操作。 2hr数据监管系统1。平台为CS架构。教师和管理员可以对学生实验机集群管理,包含实验机创建、停止、销毁等。系统对集群内所有实验机进行监控,包含编号、所属服务器、创建时间、运行状态、开放端口。(提供系统截图加以证明) 学生在实验过程中可以编写和提交实验报告,可以添加实验截屏,和实验过程视频。 学生登录系统,即可进行实验任务在线操作;包含实训课程在线学习、实验机在线操作、实验报告在线提交、实验机界面截图等; 教师可以对自己班级的学生的实验报告进行审阅,评语和评分。 5。在实验过程中老师可以远程进入学生试验环境,可以远程指导学生实验。(提供系统截图加以证明) 6。平台可以对学生学习行为进行记录和统计分析,可以显示3张独立完整的统计报表:(1)个人统计报表:统计开始时间、统计结束时间、登录次数、学习总时长、所学课程清单;(2)班级:统计开始时间、统计结束时间、平均每个学生登录次数、平均学习时长、所学课程清单;(3)全体:平均每个学生登录次数、平均学习时长、所学课程清单。上述三张统计报表要求每张报表包含规定的所有统计数据,能在一个界面展示。(提供系统截图加以证明) 7。可以查看大数据平台硬件,包括CPU利用率、内存占用、 网络IO、磁盘IO等状态。可以查看作业排队量和完成量。能够 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 显示平台用户登录的时间信息。显示在线用户量,累积在线时 长等信息。(提供系统截图加以证明) 3hr数据市场系统平台为CS架构。支持数据上传、管理、发布等功能,为教师、学生账号提供数据类型展示、数据下载等用途。提供不少于70余个子行业的在线数据模板,用于教学过程中对于数据类型的学习、了解。每个数据模板至少包含描述、发布时间、发布单位、所属行业、数据格式、大小、以及详细的数据结构等信息。数据准备后,支持数据可视化跳转安全浏览器,数据市场系统内嵌软件,安全浏览器要求满足以下技术要求: 基础功能,支持通用浏览器标签栏、地址栏、收藏栏等常用基础功能,支持鼠标手势快捷操作、超级拖拽快速搜索、地址栏智能快速自动补全、定制化设置等多样化便捷功能;开发者工具:支持网页调试能力,包括:网页元素查看和修改,控制台输入输出,源代码查看和调试,网络请求分析,性能分析等; 本地数据安全防护,支持浏览器用户数据(历史,收藏,缓存,Cookie等)的加密存储; 3。兼容性检测工具,内置浏览器兼容性问题检测和修复工具,并支持将修复资源通过管理后台统一策略下发至终端浏览器,起到网页兼容性问题批量修复、达到正常的页面浏览效果;(提供系统截图加以证明) 4。访问控制策略,支持访问控制策略,可设置允许在企业浏览器上访问的网站的白名单;(提供系统截图加以证明) 5。国密网关管理,支持国密网关的管理配置,通过网关、应用系统的配置绑定,实现业务应用只能在企业浏览器上访问的功能;(提供系统截图加以证明) 6。可信应用调用,支持对可信应用(如wps文档、表格、幻 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 灯片等)的白名单信任预处理,实现在浏览器中直接调用可信应用的便捷性操作;(提供系统截图加以证明) 7。产品资质,产品具备第三方有权机构出具的产品测试报告 (提供第三方有权机构出具的检测报告的扫描件), 产品具备国家密码管理局颁发的商用密码产品认证证书(提供证书的扫描件) 4hr编程式数据实验平台平台为CS架构。平台基础功能支持Linux虚拟桌面实验台、支持兼容JupyterNotebook的实验台、支持兼容RStudio的实验台,包括Hadoop、Hive、Spark、Python、R及Ubuntu等;提供实验过程中需要学习和使用的多种软件。 编程式大数据平台支持x86服务器组成的计算集群。可以根据需要,通过增加服务器节点的方式进行水平扩展,以提高用户支撑的数量和性能。系统可以运行在CentOS等主流linux系统。 采用Docker轻量级虚拟化技术,支持大量用户高并发实验,支持实验机节点个数的设置。 实验用户之间环境隔离、互不干扰、单个用户启动或关闭实验环境不影响其他用户的操作。 用户可以完全关闭实验环境,下次需要重启;也可以关闭并保存当前实验状态,下次无需重启直接进入当前的实验步骤。 实验环境支持业界流行的hadoopspark框架,支持Hadoop、 Spark、R、Python、MongoDB、Kafka、HBase、MySQL、Impala等。支持用户自主添加新类型的实验环境。 7。学生进入编程式大数据实验后,在实验过程中,可以隐藏和打开指导书。支持实验操作台支持隐藏和显示的工具栏显示试验机的服务器节点列表,通过鼠标点击可以自动切换到不同 服务器节点的桌面环境。(提供产品界面截图加以证 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 明) 支持实验虚拟环境和外部环境粘贴复制功能。 支持实验虚拟环境中数据文件和外部环境交换。 实验环境支持远程端口开放,以方便远程登录协助。 实验环境支持管理端强制关闭和被监控。 5hr图形式数据实验平台1。平台为CS架构。图形式大数据实验平台支持图形化(鼠标拖拽)的方式进行教学科研的大数据实验。 2。对于用户经常使用的数据组件,在客户端的主界面工具栏上显示快捷操作,可以在不进入组件面板的情况下直接拖拽使用。(提供产品界面截图加以证明) 在不需要编程序的基础上,用户可以采用鼠标拖拽设计开发ApacheSpark大数据批式(非实时)处理作业(数据工作流)和大数据流式(实时)处理作业(流式数据工作流),可以支持大数据全链路的功能,包括数据源定义、数据汇集、数据加工、分析挖掘、数据可视化。(提供产品界面截图加以证明) 数据工作流设计器提供编辑功能,可以对数据工作流的各个节点进行布局排版,提供13种排版功能,包括:左对齐、右对齐、左右居中、上对齐、下对齐、上下居中、水平均布、垂直均布、水平增加间距、水平减少间距、垂直增加间距、垂直减少间距、树布局。提供全选、反选、复制、粘贴、删除工作流节点组件的功能。数据工作流的每个数据节点可以在底部显示其名字,支持超长的名字自动换行以保证名字文本的长度始终不超过节点图标的宽度。支持鼠标拖拽图标的四个角改变工作流节点尺寸。两个相匹配的数据节点可以通过鼠标右键创建连接线。 平台至少提供四类图形式工作流节点组件方便用户设计大数 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 据工作流,包括:数据源类型节点、转换类型节点、算法类型节点、和落地类型节点。要求每种类型的组件在工具栏上分组显示,可以通过鼠标拖拽来使用,可以设置工具栏的隐藏和关闭。 6。平台支持至少13种数据源功能包括:关系数据库、MongoD B、HDFS、FTP、文件夹、Hbase、系统Hive、Cassandra、流、云文件、云数据库、课程文件、课程数据库。(提供产品界面截图加以证明) 7。平台支持至少6种数据转换功能:包括通用转换、流转换、自定义、分组标签、抽样、行转列。(提供产品界面截图加以证明) 8。支持图形化调用主流统计和数据挖掘算法,包括回归、支持向量机、朴素贝叶斯、关联规则、主成份分析、PLS、层次聚类、逐步回归、随机森林、Lasso回归、神经网络、决策树、标准差、峰度、百分位数、移动平均、相关系数、单因素方差分析。(提供产品界面截图加以证明) 9。平台支持6种数据落地功能,包括ES落地、HDFS落地、I mpala落地、Hive落地、Cassandra落地、云文件落地。(提供产品界面截图加以证明) 10。提供调试运行功能,包括设置断点、设置目的地、校验元数据、设置查看器、设置落地的功能。启动调试任务后,可以推送相匹配的调试日志。调试日志以三类图标显示:错误信息红色图标、警告信息黄色图标、一般信息黑色图标。支持通过日志信息快速定位到关联的工作流节点的功能。 11。支持以树形结构显示大数据项目、大数据工作流、工作流节点、工作流节点元数据、支持元数据名字和类型和长度的显示。 12。可以对数据工作流设置调度任务。支持工作流调度的启 序号 货物名称 技术参数及要求数量 单位 所属行业 动、暂停、停止、删除。调度规则支持cron表达式,可以设置邮箱发送调度信息,可以查看历史调度日志。可以对流式的数据工作流单独设置作业调度。(提供产品界面截图加以证明) 13。关系型数据节点支持对以下信息的配置:IP、端口号、用户名、密码、数据库类型,支持实时显示数据库表的元数据,包括:主键,列名,类型,长度,精确度,小数点位数,可否为空,是否唯一,以及比对。(提供产品界面截图加以证明) 关系数据库抽取类的数据工作流节点可以设置是否增量抽取、是否数据落地、处理前是否先清空落地数据、是否全量变换。这4个属性的设置状态可以直接在该节点的图标上有对应的标志位显示。用户可以手工设置分片控制列和分片数目,可以设置是否合表操作。 文件夹类型数据节点支持对以下信息的配置:名字,描述,主机地址,用户名,密码,文件路径,编码,是否包含子文件夹,过滤条件。 FTP类型数据节点支持对以下信息的配置:名字,描述,主机地址,用户名,密码,文件路径,编码,是否包含子文件夹,过滤条件,协议,加密方式,匿名访问,最大连接数,传输模式。 17。文档抽取数据节点支持对以下信息的配置:行格式、分隔符、字段长度、标题行号、第一行数据行号、行分隔符、行分隔符位置、后处理、合并所有。(提供产品界面截图加以证明) 18。XML抽取数据节点支持对以下信息的配置:xsd文件、合并 所有、xsd文件路径、后处理。 序号 货物名称 技术参数及要求数量 单位 所属行业 转换数据节点支持历史数据追踪功能,支持历史数据开始日期、是否有效、结束日期的自动化管理。 平台提供多种数据集关联功能包括内连接,左连接,右连接,全连接,合并,合并所有。 21、大数据平台支持图形式读取非关系数据库数据源包括Mon goDB、HDFS、FTP、共享文件夹、Hbase、Cassendra、Kafaka。22、数据挖掘节点支持在创建时由系统自动化生成训练转换器,以方便训练数据导入。 23。支持以图形式操作把实验的中间结果和最终结果写入到关系型数据库包括DB2,Oracle,SQLServer,Hana,TeraData,RedS也可以写入到非关系型数据库:ElasticSearch、H DFS、Impala、Hive、Cassandra。 24。支持表达式编辑器,用ANSISQL脚本书写,在数据节点的过滤条件和数据集关联条件中可以进行配置,支持智能输入提示,用户手工输入一个对象的前几个字符,则自动弹出下拉列表。(提供产品界面截图加以证明) 图形式支持xml,csv,word,excel,pdf,weblog等文件类型数据的模板化解析。 大数据平台的服务端模块支持采用业界流行的hadoopspar k大数据计算框架,支持Cloudera和Apache版本的Hadoops park。大数据平台的服务端模支持CentOS,RedHat等主流lin ux系统。 提供分组标签转换功能,能够根据设定的分组条件、排序条件和打标签条件,对流入数据的每一行给一个标签。 大数据平台支持通过用户通过java语言自定义开发数据处 理功能模块和数据挖掘模块。自定义模块可以集成到用户通过鼠标拖拽方式开发的数据工作流之中。 序号 货物名称 技术参数及要求数量 单位 所属行业 大数据平台提供至少89种图形化封装好的数据加工转换器组件(函数),可以分别针对文本、数值、集合、日期数据类型的数据进行加工处理。可以通过图形式使用这些函数。支持通过鼠标右键创建数据转换器之间的输入输出连线。以图形化组件形式提供下列数据加工转换器功能:词语提取,数组词语提取,数组分割,ASCII查询,UNICODE,相似性,ASCII反查,模式搜索,字符重复,数值转文本,文本转数值,替换,左截取,右截取,子串,长度,串反转,转小写,转大写,左修剪,右修剪,修剪,串拼接,CSN转串,国家,省,城市,区,街道,二进制转串,绝对值,随机数,反余弦,自然指数的幂,舍入,反正弦,往下取整,正负符号,反正切,自然对数,正弦,对数,平方,往上取整,圆周率,平方,余弦,幂,正切,余切,弧度,四则计算,模式搜索,精度转换,常量,集合写入,集合读取,集合移出,数组写入,数组读取,数组移出,条件判断,空值处理,空值统计,系统日期时间,文本转日期时间,日期时间转文本,日期转文本,日期差,日期标准化,日期转系统文本,日期部分信息,日期转UNIX时间,UNIX时间转日期,日期增加,项目编号,项目名字,工作流编号,工作流名字,大数据Job编号,大数据任务编号,分词,训练,反向量化,数值组装,规则查询,CSV组装,反向正规化。 图形式分别支持流式和批式大数据工作流的调度。调度策略支持Cron表达式。调度策略中可以设置发送邮件,查看历史运行日志等。 支持对数据工作流调式,包括设置断点、数据查看器、运行目的地。支持工作流的启动、停止、暂停。 支持异常数据处理,可以在数据工作流的主节点上创建异常 捕获节点,当出现数据异常时,数据自动分流,以方便排错和差异化处理。要求异常数据处理节点的列属性包括所对应数据 序号 货物名称 技术参数及要求数量 单位 所属行业 节点的所有上游数据节点的列,同时自动创建一个ERROR列,用于捕获具体的错误信息。 33、支持多人同时登录,团队协作开发,在一个工作流被一个用户打开后,对其他用户能够自动加锁,防止冲突。 34。支持常见的数据聚合功能,包括平均值、最大值、最小值、数值求和(sum)、字符串累加、计数等。(提供产品 界面截图加以证明) 6hr数据可视化平台平台为BS架构。支持用户在进行数据可视化分析时,可自由进行鼠标点击拖拽式操作完成界面布局,同时页面缩放可自动实现组件宽高适应调整,不同分辨率以及缩放都可以获得更好的适应显示。 支持明细表组件,对数据进行明细展示;支持分组表组件,对数据进行行表头分组统计;支持交叉表组件,对数据进行行表头和列表头分组统计;同时支持颜色表格进行数据分析统计。 支持指标KPI卡、迷你图、热力区域图、分区柱状图、堆积柱状图、多系列柱状图、对比柱状图、瀑布图、分区折线图、多系列折线图、折线雷达图、范围面积图、组合图、散点图、聚合气泡图、饼图、多层饼图、玫瑰图、矩形树图、词云、漏斗图等丰富的图表分析组件。 支持根据用户拖入的字段,为用户智能推荐合适的可视化图表。 5。支持区域地图、点地图、流向地图、热力地图,可进行省、市、县级别的地图数据分析,同时支持用户直接在浏览器前端进行地图自定义设计,包括地理地图、自定义图片地图、自定义GIS地图背景、地理位置和经纬度自定义匹配等功能,帮助用户进行快速自定义地图编辑设计。(提供产品界面 截图加以证明) 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 6。支持日期、日期区间、年份、年月、年季度类型的时间过滤控件;支持单选或多选文下拉、文本标签、文本列表类型的文本过滤控件;支持下拉树、树标签、树列表类型的树过滤控件;支持数值区间、区间滑块类型的数值控件,同时支持复合查询控件,可进行复杂且或组合逻辑过滤;支持控件可指定特定组件进行数据过滤。 7。支持web组件,可进行网页url嵌入分析;支持图片组件,可嵌入图片进行分析展现;支持富文本组件,可输入文字和动态字段进行复合信息展现,支持word级别的字体大小、颜色、对齐等属性调节。(提供产品界面截图加以证明) 8。支持查询按钮,可实现点击查询按钮之后方进行数据查询,重置按钮实现点击重置按钮清空所有过滤条件。(提供产品界面截图加以证明) 支持快速对图表进行颜色、大小、单位、宽度、圆角、标签、提示、细粒度等设置,同时支持数据字段和对应属性进行绑定设置,支持快速对组件进行标题、标题栏、图例、轴线、网格线、背景等设置。 支持用户对图表进行局部放大查看,支持在查看图表时进行图表的局部缩放以及单个组件进行放大查看。 11。支持组件复制,在同一个仪表板中进行组件复制;支持组件复用,可复用不同仪表板中的组件。(提供产品界面截图加以证明) 12。支持动态字段作为参数在组件标题中使用,实现灵活的动态标题显示功能,如A组件和B组件联动,如点击A组件中的X X省联动到B组件进行过滤时,B组件动态命名为XX省销售情况统计作为标题进行显示。 13。支持图表添加文字或图片注释以及闪烁动画,可由用户自由 序号 货物名称 技术参数及要求数量 单位 所属行业 定义条件进行动态展示。 14。支持用户创建的模板进行多层分组,可以批量删除,移动,方便用户对于模板的有效管理,普通用户可以将模板分享给其他部门岗位或者角色的用户,普通用户自己制作的模板,在制作完成后,可以申请给超级管理员挂至目录树节点给其他用户查看。 15。支持用户给已经完成的模板创建任何人都可以访问公开链接,便于即时进行公开分享。(提供产品界面截图加以证明) 16。支持直接对维度和指标进行排序、对指标进行排名、计算组内累计值以及累计值、计算组内所有值以及所有值,快速计算同比、环比、同期、环期,支持使用记录数对维度进行计数,对指标快速进行求和、求最大值、最小值、平均值、中位数、标准差、方差、占比等,无需书写任何公式。(提供产品界面截图加以证明) 17。支持丰富的函数运算,如字段拼接、类型转换、if运算,s witch运算等常用Excel形式的函数,支持通过变量之间聚合的运算新增指标。 18。支持对分组表和交叉表自动进行行列汇总计算,支持行列的定义合计方式,如求和、最大值、平均值、最小值、中位数、标准差、方差。(提供产品界面截图加以证明) 支持表格动态数值预警功能和图形设置动态警戒线,以实现数据预警分析。 支持用户进行自助数据集处理,可以提供元数据给分析用户,使其在分析过程中自由地处理元数据,处理后的数据结果可以直接用于分析,也可以基于此分析结果继续进行处理。 支持钻取操作,通过设定钻取层级目录,实现对表格以及图 序号 货物名称 技术参数及要求数量 单位 所属行业 形进行数据层级钻取。 支持组件之间任何有来自同一张表的数据无需任何设置可以直接进行联动过滤,同时支持组件和组件之间设置联动分组,支持手动设置组件和组件之间的联动。 支持预览分析时对数据进行指标切片操作 支持对跳转的分析模板设置过滤字段,实现中仪表板之间的数据过滤跳转;支持对网页链接的跳转,网页URL地址中可拼接动态字段值作为参数传递给目标地址,实现页面之间的过滤跳转。 业智能平台支持多种风格主题的自由切换,支持背景图表L OGO等的自定义行为。 26。支持设置钻取目录,实现预览分析时对数据进行维度转换操作。(提供产品界面截图加以证明) 安全防护:包括Cookie增强、文件上传校验、SecurityHe aders三部分 SQL防注入:SQL防注入通过禁用特殊关键字与转义字符两种方式来防止恶意的参数输入。 29。支持短信平台功能,并可用于用户账号身份验证、内存阀值通知(如设置触发条件,服务器内存高于xx并且持续xx分钟时,触发收件人进行短信提醒功能)。(提供产品界面截图加以证明) 30。支持仪表板的定时作业调度,将生成的仪表板以文件形式导 出定时推送给相关角色或者部门人员,支持客户端推送、邮件推送以及APP推送。 7《大数据理论基础 与应用实每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、 实验需要的数据、以及示例代码或模型。对于关键性实验提供 1套软件和信息技术服 务业 序号 货物名称 技术参数及要求数量 单位 所属行业 战》资源包 实验高清视频。资源至少包括: 项目一:销量随年份如何变化?任务(一)探索销售数据, 实验(I)探索销售数据,实验(II)汇集销售数据到数据湖, 任务(二)销售数据加工,实验(I)销售表数据去重、空值 处理,实验(II)根据产品单价和订货量计算每单,任务(三) 统计每年销售收入,实验(I)统计每年销售收入,任务(四) 各年份销售总额可视化展示分布条形图和表视图,实验(I) 全年订货总价分布条形图与表视图。 项目二:购买的顾客有哪些特征?任务(一)购买的用户特 征,实验(I)购买的用户特征,实验(II)购买顾客聚类。 项目三:如何设计一个爆款产品?,任务(一)如何设计一 个爆款产品,实验(I)如何设计一个爆款产品。 项目四:采购部门如何精确预测某配件的需求量,任务(一) 配件采购预测,实验(I)用移动平均算法预测配件采购量。 项目五:市场部如何合理选择销售实体店位置,任务(一)实 体店收入数据加工,实验(I)实体店收入数据加工,实验(II) 每个实体店的总收入可视化,实验(III)人口、实体店数据、 商业数据,实验(IV)城市类型与实体店销售总收入可,实验 (V)实体店销售收入数据训练Lass,实验(VI)预测候选实体 店的销售收入,实验(VII)预测销售收入可视化。 项目六:市场部选择广告投放方案,任务(一)购买产品的 顾客有哪些特征?,实验(I)用线性回归选择广告投放方案。 项目七:如何进行产品精准营销?任务(一)性别、年收入、 年龄是否影响购买,实验(I)性别、年收入是否影响购买自行, 实验()年收入对产品购买结果的影响,实验()客户年 龄离散化,实验()年龄是否影响购买产品,任务(二)用 神经网络发现潜在购买产品客户,实验(I)用神经网络发现潜 序号 货物名称 技术参数及要求数量 单位 所属行业 在购买产品。 项目八:客服部对客服人员绩效评估量化,任务(一)客服人员效绩评估量化,实验(I)客服人员效绩评估量化。 项目九:网销部如何进行网络公关?任务(一)产品评论情感分析及可视化,实验(I)产品评论情感建模,实验(II)产品评论词云图。 项目十:财务部门如何监控财务状况,任务(一)财务数据可视化,实验(I)可视化准备数据落地到个人库,实验()五大财务比率可视化分布条形,实验()公司利润表可视化 气泡图,实验()现金流量表可视化时间序列折线。 项目十一:法务部门事故产品理赔预测,任务(一)用决策树审核交通事故是否理赔,实验(I)计算交通事故理赔数据的相关,实验(II)用决策树审核交通事故是否、 项目十二:人事部门如何通过大数据进行离职预警,任务(一) 企业员工离职预警,实验(I)企业员工离职预警。 8hr《营销大数据融合教学案例》资源包每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:市场需求分析:家政市场需求分析; 项目二:目标客户群体分析:奶产品目标客户群体分析;项目三:论坛营销:通过网上客户评论进行情感分析; 项目四:自媒体营销:自媒体文章词云图分析; 项目五:微博营销:影响大V的关键因素分析;项目六:网络营销环境调研:网民分析; 项目七:网络消费者行为:抽取用户表并通过用户信息给用户打标签、用户商品购买关联规则; 项目八:网络营销价格策略:根据同类商品价格定价、分析 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 电商平台热门商品; 项目九:网络营销渠道策略:银行营销活动精准营销、推广位选择; 项目十:网络营销广告策略:匿名分类特征量化、历史广告点击数据模型训练、广告点击率预测; 项目十一:推广访问量统计分析:PV分析、UV(日活,月活)分析、留存预警、转化分析; 项目十二:商品调价模型:书包价格数据可视化、计算书包价格调整的幅度百分比; 项目十三:品牌舆情:通过社交数据进行品牌口碑分析; 项目十四:客户生命周期分析:用户价值分析(RFM) 9hr《电子商务大数据融合教学案例》资源包每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:电商平台数据分析:母婴用品销量分析、电商用户访问行为分析; 项目二:网络营销环境调研:根据同类商品价格定价、用户购买商品关联规则分析; 项目三:网络营销策略:预测二手车平台上车的价格、推广位统计分析、广告点击预测、预测网上购物者购买意向; 项目四:客户管理:电商店铺客户画像、RFM用户聚类分析;项目五:售后用户分析:用户评论分析、评论情感分析建模和评价; 项目六:供应链风险分析:用决策树预测供应链订单是否会延期; 项目七:物流管理与分析:选择费用最低的快递公司; 项目八:电子商务支付与安全:电商支付方式统计分析、利用 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 多层感知机识别支付是否安全。 10hr《物流大数据融合教学案例》资源包每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:农作物物流分布:全国XX产量分布分析; 项目二:物流需求预测分析:预测XX年XX货邮吞吐量;项目三:供应链关系:供应关系分析; 项目四:采购预算:用移动平均算法预测配件采购量; 项目五:运输成本分析:选择费用最低的快递公司、快递成本可视化、物流运送量分析驾驶舱、物流赢利分析驾驶舱; 项目六:配送中心选址分析:预测新建配送中心位置; 项目七:配送管理:预测配送优先级、根据货主需求推荐车辆、物流公司装货时间预测; 项目八:快递点分布:XX快递网点分布;项目九:物流客户画像:货主客户画像; 项目十:物流企业客户舆情分析:物流投诉分析、物流投诉热 词词频统计、物流投诉分析驾驶舱 1套 软件和信息技术服务业 11hr《人力资源大数据融合教学案例》资源包每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:招聘与配置:招聘结果分析、招聘过程漏斗;项目二:人员能力测评:预测面试人员工作能力; 项目三:绩效管理:使用固定值作为平均销售额的KOI指标、三年同期销售分析、销售数据行列转换、使用实例平均月销售额作为本期KPI指标; 项目四:薪酬管理:收入是否超支; 项目五:员工关系管理:员工满意度模型训练、员工满意度模 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 型预测; 项目六:员工兴趣爱好聚类:员工兴趣爱好聚类;项目七:企业员工离职预警:企业员工离职预警;项目八:劳动管理管理:劳动关系文本分类分析 12hr《金融、保险大数据融合教学案例》资源包每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:利用大数据的投资分析:投资项目数据缺失值处理、投资项目数据加工统一币种金额、分析国内股权投资发展经历、历年风投行业偏好热力图、各年份投资轮次偏好热力图、最活跃投资机构排行、细分行业投资排行、各币种累计投资金额、累计投资金额热力地图; 项目二:利用大数据分析投资回报率:投资回报率计算平均投资额、投资回报率建模数据预处理、投资回报率量化、投资回报率建模、投资回报率预测数据预处理、投资回报率预测;项目三:利用大数据评估投资回报价值:评估公司投资价值是否被高估或低估数据预处理、评估公司投资价值是否被高估或低估量化、评估公司投资价值是否被高估或低估建模、评估公司投资价值是否被高估或低估预测; 项目四:投资组合的收益计算:投资组合收益、投资组合内的股票相关性分析、随机组合投资风险与收益、最优投资组合;项目五:社会舆情对股票指数的影响:新闻标题数据预处理、统计热词词频、计算日热词与前一周热词重复数、热词重复数与股票指数线性回归分析; 项目六:商业银行贷款风控:导入原始业务数据、理解原始数据、丢失属性的处理、挖据预处理标准化、建立风控预测模型、 数据可视化:贷款审批结果输出、模型预测评价; 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 项目七:信用卡逾期侦测分析:信用卡数据探索1描述统计、信用卡数据探索2标准差、信用卡数据预处理缺失值替换、贷款人群年龄分布、信用卡数据探索月收入分布、信用卡逾期的高发人群分析、属性特征与是否逾期的相关性分析、训练逻辑回归模型、信用卡测试数据探索和缺失值替换、逻辑回归模型 预测是否逾期。 13hr《数据源与数据湖》资源包每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。资源至少包括: 关系型数据库:关系型数据库简介、关系型数据库应用场景、关系型数据库运行环境、关系型数据库数据存储结构和约束、关系型数据库写入数据、关系型数据库读取数据、关系型数据库删除和修改、小结 NoSQL:NoSQL简介、应用场景、运行环境、数据存储结构、写入数据、读取数据、删除和修改、优缺点; 消息:简介、应用场景、运行环境、数据存储结构和约束、写入数据、读取数据、优缺点; 网页数据:简介、应用场景、运行环境、数据存储结构和约束、读取数据、优缺点; 应用系统:简介、应用场景、运行环境、数据存储结构、数据操作、优缺点。 实验清单:Ubuntu安装MySQL、关系型数据库MySQL数据库运行环境、MySQL插入带约束的学生信息、Java使用MySQL事务写入学生信息、MYSQL导出导入学生数据、MySQL创建学生信息表、用Java语言读取学生信息表元数据、MYSQL查询学生信 息、MySQL更新与删除学生信息Java、MySQL分区写入销售数 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 据、MySQL删除和修改学生表约束、MySQL更新与删除学生信息、 MYSQL从视图查询学生信息、MYSQL多表联合操作实验、用MYS QL语言读取学生信息表元数据、MySQL使用事务语言写入学生信息、关系型数据库运行环境、mongodb安装、mongodb写入、 mongodb创建索引、mongodb普通查询、mongodb高级查询、mo ngodb的修改与删除、ActiveMQ安装及环境配置、ActiveMQ点对点传输模式、ActiveMQ发布订阅模式、安装kafka、kafka消息读写、Tomacat部署及发布、通过爬虫抓取网络图片、通过T CPIP协议实现客户端与服务端通信、java实现http通信、获 取12306火车车票信息、通过API获取天气信息。 14hr《数据加工》资源包每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括: (1)选择(2)变换、条件判断(3)关联(4)聚合、排序(5)窗口(6)标签(7)旋转(8)缺值处理(9)数据冲突处理、数据探索(10)数据画像(11)数据抽样、数据统计描述(12)数据相似性(13)数据异常(14)数据去重(15)维规约、数值规约(16)噪音数据(17)数据量化(18)数据离散化。 实验清单至少:获取语文成绩至少100分的学生、获取语文 成绩至少100分的学生py、从网络日志中提取用户访问页面、从身份证号中获取用户信息、从天气数据中获取地区和温度、通过用户身份证号判断用户性别、对学生英语成绩进行分类、从网络日志中提取用户访问页面py、从身份证号中获取用户信息py、从天气数据中获取地区和温度py、通过用户身份证号 判断用户性别py、对学生英语成绩进行分类py、通过用户身 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 份证号获取户口所在地、通过用户身份证号获取户口所在地p y、各班成绩聚合查询、用户访问所有页面汇总、各班成绩聚合查询py、用户访问所有页面汇总py、航班飞行数据打标签、学生成绩表格行转列、学生成绩缺值替换、数据缺值删除、单值个数统计、数据冲突处理之计算非空值百分比、房屋价格标准差、城镇人均犯罪率与业主自用房价因素方差分析、业主自用房价格中位数(MEDV)的分位值、房价峰度计算、城镇人均犯罪率与业主自用房价相关系数分析、业主自用房价的移动平均值、用户年收入数据画像、用户查询词数据画像、鸢尾花抽样、数据相似性计算、年龄中异常数据的检测、去除年龄中的异常数据、鸢尾花种类去重、鸢尾花特征主成分分析、鸢尾花特征线性回归、鸢尾花特征主成分分析py、鸢尾花特征线性回归py、量化用户上班距离、量化用户上班距离py、年龄离散 化、年龄离散化py。 15hr《数据分析与挖掘》资源包每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括: (1)描述性统计分析、(2)时间序列分析、(3)单因素方差分析、(4)数据正规化、(5)主成分分析、(6)线性回归、逐步回归、(7)偏最小二乘回归、(8)逻辑回归分析、(9)聚类、(1 0)朴素贝叶斯、(11)支持向量机、(12)神经网络、(13)关联规则、(14)决策树、(15)随机森林。 实验清单:鸢尾花的描述性统计分析、鸢尾花的统计综合指数分析、鸢尾花的统计平均指数分析、鸢尾花的众数统计分析、 鸢尾花的中位数统计分析、鸢尾花的方差统计分析、鸢尾花的 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 标准差统计分析、计算鸢尾花的峰度、计算鸢尾花的相关系数、计算上海房价的百分位数、鸢尾花的描述性统计分析python、鸢尾花的众数统计分析python、鸢尾花的中位数统计分析pyt hon、计算鸢尾花的相关系数python、计算鸢尾花的峰度与偏度python、计算上海房价的百分位数python、用移动平均法预测房价、用移动平均法预测人均GDP、用移动平均法预测房价 python、用移动平均法预测人均GDPpython、水稻不同品种亩产量的单因素方差分析、水稻不同品种亩产量的单因素方差分析py、鸢尾花数据的正规化、鸢尾花数据的正规化python、青蛙叫声数据的主成分分析、青蛙叫声数据的主成分分析pyth on、用线性回归预测足球运动员身价、用线性回归预测发电站电力输出、用线性回归预估商品的销售额、对工资水平进行逐步回归、用岭回归预测街道上公共产品使用量、用Lasso回归预测房价、用线性回归预测足球运动员身价py、用线性回归预测发电站电力输出py、用线性回归预估商品的销售额py、用岭回归预测街道上公共产品使用量py、用Lasso回归预测房价 py、用偏最小二乘预测楼房的能源效率、用偏最小二乘预测楼房的能源效率py、用逻辑回归对鸢尾花进行分类、用逻辑回归对鸢尾花进行分类py、用层次聚类分析电信用户信用、用KM eans细分青少年兴趣、用层次聚类分析电信用户信用py、用K Means细分青少年兴趣py、用朴素贝叶斯判断是否接受贷款申请、用朴素贝叶斯判断是否接受贷款申请py、用支持向量机判别是否是矿石、用支持向量机判别是否是矿石py、用神经网络判别小麦种子等级、用神经网络诊断是否是乳腺癌、用神经网络判别人体活动、用神经网络判别小麦种子等级py、用神经网络诊断是否是乳腺癌py、用神经网络判别人体活动py、互联 网日志关联分析、互联网日志关联分析py、用决策树判断电离 序号 货物名称 技术参数及要求数量 单位 所属行业 层的好坏、用决策树审核交通事故是否理赔、用决策树发现银行即将流失的客户、用决策树评估个人信贷信用好坏、用决策树判断电离层的好坏py、用决策树审核交通事故是否理赔py、用决策树发现银行即将流失的客户py、用决策树评估个人信贷信用好坏py、用随机森林预测鲍鱼环的数量、用随机森林判断青少年运动障碍、用随机森林判别红酒品质、用随机森林建议地震损毁建筑的修复方案、用随机森林预测鲍鱼环的数量py、用随机森林判断青少年运动障碍py、用随机森林判别红酒品质 py、用随机森林建议地震损毁建筑修复方案py。 16hr《数据可视化》资源包每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括:(1)可视化的释义、(2)可视化简史、(3)数据可视化基础框架、(4)可视化中的数据、(5)可视化设计原则、(6)可视化理论发展、(7)可视化准备、(8)分组表:统计不同合同类型和付款类型下的合同金额、(9)交叉表:统计不同年份下不同合同类型和付款类型的合同金额、(10)明细表:统计合同签约明细数据、(11)柱形图:比较年度合同总额、 (12)点图:总览月合同金额、(13)热力点图:从颜色分析用户类型与年龄的分布、(14)线形图:观察注册人数随时间的变化趋势、(15)面积图:观察不同平台下的用户浏览量随时间的变化趋势、(16)矩形块图:分析不同平台和不同阶段的网站访问时间分布、(17)饼图:分析网站在不同阶段的访问时间占比情况、(18)文本图:使用词云图分析网站搜索的关键词、(19)地图:观察不同城市的销售情况、(20)漏斗图:平台用户访问 阶段漏斗转化分析、(21)仪表盘:观察平台用户访问时间达标 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 率、(22)气泡图、(23)雷达图。 17《python 》资源包每一门课程要求提供理论教学所需要的PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括:(1)开发Python环境:Spyder开发Python环境、(2)wordcount、(3)Python语言基础:输入输出操作、数据类型和变量、字符串和编码、使用list和tuple、dict和 set、高级特性(切片、迭代、列表生成式、生成器)、条件判断和循环语句、函数、(4)Python语言统计建模:数据导入、数据结构、数据切片、描述性统计、可视化处理、Numpy库操作、 Scipy库操作、Pandas库操作、Scikilearn库操作、(5)Pyt hon可视化、(6)机器学习算法导论、(7)Sklearn机器学习入门、(8)数据降维:MNIST手写数字图片降维、(9)随机森林:使用随机森林进行红酒品质分类、用随机森林判断青少年运动障碍、用随机森林通过青蛙叫声判断类别、用随机森林预测产品需求量(10)决策树:用决策树评估个人的信用卡信用好坏、用决策树判断是否接受贷款申请、用决策树发现银行即将流失的客户(11)K近邻:使用K近邻诊断疾病、(12)时间序列分析:航班乘客时间序列分析(13)聚类:用KMeans细分消费者兴趣、用KMeans聚类分析电信用户信用(14)支持向量机:用SVC进行人脸识别、(15)关联规则:用神经网络判断小麦种子等级、用神经网络预测人体活动、用神经网络预测网络新闻流行度、用神经网络判别是否是矿石、用神经网络判断是否推荐衣服(16)线性回归:用线性回归预估商品的销售额、用线性回归预估商品的销售额(17)偏最小二乘:用偏最小二乘预 测楼房的能源效率(18)深度学习:用Tesorflow识别手写数 1套 软件和信息技术服务业 序号 货物名称 技术参数及要求数量 单位 所属行业 字、用Tesorflow识别手写数字进阶 18hr数据创新应用平台平台为CS架构。支持创建科研项目,设置项目的名称、简介、是否公开等属性。(提供产品界面截图加以证明) 可以查看非自己的公开项目信息。 3。每一个科研项目可以设置一个项目主页,展示项目组长、项目简介等基本信息。(提供产品界面截图加以证明) 项目模型支持图形式大数据引擎的全部功能,可以快速对科研数据进行全链路大数据分析建模,包括数据源定义、数据汇集、数据湖管理、数据加工、分析挖掘和可视化展示。(提供产品界面截图加以证明) 项目文档功能可以建立不同的文件夹结构,对项目相关的各类文档分别管理。 项目文档下的每一个文件夹中,可以在线创建、编辑项目文档,也可以上传本地文件作为附件。 项目数据功能可以对项目涉及到的所有数据按文件和数据库分开进行管理,支持项目文件的本地上传和删除。数据库数据可以设置允许可视化。 可以对项目的基本信息进行编辑,包括:名称、是否公开的状态、项目简介、项目成果等。 可以对项目组的成员进行管理、非授权的用户不能参与该项目的工作。 项目组成员可以进行协同工作,可以共享各种项目资源。可 以将项目设置为公开或私有,公开的项目,系统的任何用户都可以浏览项目信息。 1套 软件和信息技术服务业 19hr终端安全管理系统1。平台为CS架构。操作系统支持:WindowsXPSP3及以上WindowsVistaWindows7Windows8Windows10、WindowsSe rver2003SP2WindowsServer2008WindowsServer2012 1套软件和信息技术服 务业 序号 货物名称 技术参数及要求数量 单位 所属行业 WindowsServer2016、中标麒麟银河麒麟Deepin中科方德SUSELinuxRedHatLinuxcentOSUbuntu12以上版本 2。控制中心:采用BS架构管理端,具备设备分组管理、策略制定下发、全网健康状况监测、统一杀毒、统一漏洞修复、网络流量管理、终端软件管理、硬件资产管理以及各种报表和查询等功能。 3。支持自主授权分割功能,管理员可以从主系统中心分割授权客户机数量给下级系统中心,限制下级系统中心对客户机的注册数量,阻止非法客户机注册。(提供系统截图加以证明) 4。支持多种分组规则,如IP分组以及支持与AD、LDAP同步功能,可将用户组织架构同步到终端安全管理系统中,依照用户现有架构进行管理。分组支持无限层次分组,支持生成组安装包,安装后自动进入该分组。(提供系统截图加以证明) 5。具有移动终端防护软件,并可接入系统中心平台进行统一管理(提供系统截图加以证明) 6。支持浏览器防护,对篡改浏览器设置的恶意行为进行有效防御,并可以锁定默认浏览器设置(提供系统截图加以证明) 7。要求支持通过数字签名或者文件名的方式分别显示文件,方便管理员管理全网终端上报的文件;(提供系统截图加以证明) 8。支持文件解压缩病毒查杀,支持对zip、rar、7z等多种格式的压缩文件查杀能力;默认支持32层压缩扫描,且用户可以自定义设置扫描层数(提供系统截图加以证明) 9。可以提供对各类即时通讯工具、邮件、网络下载工具、文件, 序号 货物名称 技术参数及要求数量 单位 所属行业 文件类型至少支持。dll、scr、rtf、pps、zip、MP4、AVI、wmv、 RMVB、psd、jpeg、bat、cfg,apk、lnk等保存到本地文件的查杀功能,并进行文件审计,可查看文件审计列表,并可对任意审计文件进行追溯(提供系统截图加以证明) 支持大数据AI智能补丁验证功能,支持自定义补丁排除名单,防止终端打补丁后造成系统或业务进程崩溃; 终端支持智能屏蔽过期补丁、与操作系统不兼容的补丁,可以查看或搜索系统已安装的全部补丁;(提供系统截图加以证明) 产品具备漏洞集中修复过程中的流量控制和保证带宽,补丁分发支持服务端带宽限流,有效节省外网带宽资源(提供系统截图加以证明) 13。支持宏病毒程序行为监测;并能够提供详尽的分析报告。支持的文件类型,必须覆盖:PE类文件(EXE、DLL、OCX、SYS、 COM);文档类文件(OFFICE、WPS、PDF、RTF、FLASH);压缩文件(7z、apk、arj、bz2、cab、exe、gzip、lzh、rar、zip); 图片文件(GIF、JPEG);报告中能够提供动态运行样本的截图, (提供样本截图)。能够提供样本文件的EXIF(ExchangeableInformation)信息作为判定参考,(提供样本截图),拥有事件关联分析能力:基于历史数据、威胁分布、脆弱性分析结果的综合判别能力; 14。支持与边界恶意代码检测设备、防火墙、文档智能管理平 台,未知威胁检测系统联动,达到网关边界联动防御效果(提供系统截图加以证明)