教你零基础入门“数据科学”,学会用数据创造更多利润!
发布时间:2018-05-01 06:32:13 浏览: 次
时尚公益课堂
第102课教你零基础入门数据科学,用“数据”创造更多利润!
【讲师】
Cliff Tsung
我是Cliff Tsung,人工智能-语义学博士。 在新加坡和西班牙生活。曾任西班牙内政部项目科学家、德国国家人工智能中心研究员(欧盟第7框架计划)。目前在马德里经营1家小画廊和1家数据科学咨询企业;同时还是社区福利食堂厨师和乐队鼓手。
*我是1名酷爱艺术的科学家,多年的人工智能、语义学研究经验让我有信心能够将数据科学与时尚行业相结合,深入浅出地为大家讲授相干的基本知识;
*我目前同时经营1家数据科学咨询企业,因此我能够从企业经营和管理者的角度动身,提供更宏观的视角,并且更加关注课程的实用性,避免堕入细节的技术讨论和“噱头词”的堆积。
1.需要明确的概念和定义
数据:有关事实的原始记录,如数字、表格、数据库和文字记录等。
信息:经过处理的事实。如排序后的数据,过滤后的数据,各种统计学指标,各种图表等。
知识:事实产生的内在缘由。可用于未知:如变量之间的数学关系,类似个体的聚类边界等。
2.数据科学在商业中的定义
“数据科学”其实不是1门独立的学科,只是1种利用数据得到知识的手段 ,和1种包括数学、统计学和人工智能等多个领域/学科的技术与工具。
简单来讲,数据科学在商业上指的是1种通过数据创造及提高利润的手段。
3.与数据科学有关的角色
部门专员:熟知公司业务并了解公司需求的人员。
决策人员:其实不仅仅企业高层才是决策人员,公司中每一个员工都可以是决策人员。
数据科学家:采取科学方法,应用数据发掘工具对大量的数字、文字和符号等信息进行数字化重现与认识等方面的专家。
需要注意的是,数据科学不能直接利用于企业。由于数据科学家不了解业务知识及各部门的需求,所以它需要各职能部门的积极参与,同时也需要决策人员根据个人经验、法律法规和行业规范等进行决策后使用。
小结:
数据科学是通过数据产生知识的1系列措施;需要职能部门的积极参与;不是唯1的决策辅助工具。
4.数据科学的工作流程:数据收集-数据整理-知识发展-知识表达
1.数据收集
在本钱允许的情况下收集任何可能的数据。比如收集用户的年龄、性别、购物习惯、对时尚的观点等,收集的维度越多越好。
数据来源包括内部数据和外部数据。内部数据包括销售数据和客户数据等,外部数据包括天气数据和城市人口散布等。
2.数据整理
数据整理是对所搜集到的资料进行检验、归类和数字编码的进程。其目的1方面是为了提高数据质量;另外一方面也是为了下降数据贮存、载入及运算的本钱。
3.学术型数据学家与商业数据科学家的区分
学术型数据学家和商业数据科学家都能进行知识发掘,而商业数据科学家更应当重视知识的有效表达。
1.分类分析
即基于已知数据对未知数据进行分类。1般分类的对象为客户、产品、雇员、供应商和服务商等。
2.聚类分析
行将类似的个体链接起来。比如:应当将本季的黑色cashmere毛衣优惠2维码发给哪些客户?1般聚类的对象为客户、产品和客户意见。
3.回归分析
即发现属性之间的关系。比如:客户身高与消费金额是不是有关?衬衫的白色与畅销程度之间的关系?1般分析以“额”“率”“值”结尾的各种属性。
4.关联规则
1般用于发掘可能同时被购买的产品 。在实际的利用中,关联规则主要利用于商品购买的关联行动。
比如针对1个卖场,可以通过对大数据的关联分析发现面包与牛奶之间的购买行动,从而可以有针对性地进行促销或是适当调剂商场的物品摆放位置。所以关联分析是大数据分析中1个特别有效的模型,针对性比较强。
小结:
当企业遇到无锡酒店保洁工作服问题时,企业家可以把遇到的问题依照以上4类进行分类,这样能和数据科学家进行更加有效的沟通。
1.关于时序回归的1点闲话
数据科学是为决策服务的。时序回归所预测的是在所有其它因素不变的情况下,我们可以预测的结果。时序回归结果最大的作用是判断我们的进程是不是失控(实际视察与预期偏差过大)。可以通过时序回归反思是不是对进程理解不足,或变量出现了我们不知道的变化。
比如:实际销售额比预测的结果高出来很多,看到这个结果,人们很容易由于开心而疏忽真实的问题,虽然销售额提高是值得高兴的事,但同时需要反思预测结果为何出现那末大的误差,有甚么因素是之前没有斟酌到的。
2.中小企业是不是需要数据科学定制连体服部门?还是雇佣外部顾问?
首先这两种方案都有衬衫定做各自的优势和劣势。比如企业中的数据科学部门会比雇佣外部的顾问更了解本企业从而能为企业做出符合企业本身情况的分析,并且节省了沟通本钱。但是企业需要投资1定数额的软硬件本钱。雇佣外部顾问的优势主要是人力本钱较低、合约类型灵活和软硬件投资本钱较低。
综上所述,企业可以选择1个折衷方案。由于数据科学部门不是紧急的需求,并且中小企业的数据量和复杂度不高,所以可以雇佣1位具有较好统计学基础和1位具有较好计算机科学基础的雇员进行培训,另外企业的管理者也应当学习数学优化和决策工程学的知识。
3.中小企业的预算应当“大人力,小硬件”
企业其实沃尔沃员工工作服不需要购买非常昂贵的电脑,由于中小企业的数据量其实不是很多,1般的电脑足以进行处理。建议投资重点应放在人材招揽、培训和知识结果的部署上。
小结:
雇佣1个数据科学家是最划算的人力投资,可以首先发掘企业内部的潜力人材加以培训。让知识辅助决策,由于数据科学不是算命。同时不要高估软硬件本钱,也不要低估人力本钱。1切从简单开始 。
本文为课堂直播精华,配合讲师讲授使用更佳哦!
点击文末“浏览原文”便可回看。
往期回顾
(点击标题便可跳转)
第1课为何我们都要关注可延续时尚?
第2课这些基础服装技术资料你都了解吗?1节课为你扫清困惑!
第3课如何与国外influencer合作双赢?来,让我为你揭开这层神秘的面纱
第4课服装面料大揭秘,1节课让你轻松成为“面料专家”
第5课教你亲身DIY做检测,对服装“质量圈套”说再见!
第6课当时尚遇上“黑科技”,未来服装业将会怎样?
第7课关于服装行业你有甚么困惑?也许这里有你想要的答案
第8课面料的色采是如何构成的?“老司机”带你参观面料染色工艺
第9课涨姿式!你1听就懂的针梭织服装工艺大全
第10课来看看这些高大上的“进口面料”有着怎样不为人知的内幕?
第101课你穿过那末多花衣裳,可曾真正晓得“服装印花”?
第102课教你零基础入门“数据科学”,学会用数据创造更多利润!
第103课如何利用“领英”链接到更多的职场资源和商业机遇?
第104课服装质量好不好,原来是“它”说了算!
第105课为什么你的零售事迹总是上不去?赶快看看货品管理做对了吗?
(点击“浏览原文”回看直播)
冷芸时尚€€专注于时尚行业
服装商业培训(买手、创业、职业计划)时尚读书会、服装零售分析
冷芸也开设以下培训课程,欢迎报名!点击图片查看详情。
如想了解课程内容,请点击“试听”
本公众号所有文章均为诚意原创。如果您浏览后感觉有所收获,感谢您最少能做以下1件事:点赞,转发,关注,打赏。感谢您对知识的尊重!