临汾山东漯河饰品美体美文
投稿投诉
美文创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品
漯河衢州
兴义眉山
桂林阳泉
玉溪简阳
山东遂宁
永城新余
梧州洛阳
泸州温州
临汾清远
营口常熟
浙江大连
桐乡宜昌

产品之路机器学习一

10月2日 话藏心投稿
  文章分享了关于机器学习的一些知识,希望能够给各位PM带来收获。
  2017年可以说是人工智能爆发的一年,传统互联网红利消失,熟知的大厂BAT都在人工智能上布局,作为一名互联网PM,深知技术的变革必然带来新机会。可对大多数互联网PM而言,面对ML(机器学习)、DL(深度学习)、NLP(自然语言处理)以及的各种概念以及底层所需的各种数学知识,不懂技术似乎让人望而却步了。
  可事实并非全然如此,AI是手段,最终的目的也是要找到现实中可以落地和商业化的场景,去实现他的价值,虽然目前来看仍然是技术主导。不过可以确信的一点是,要进入这个领域,对底层知识和技术的要求是必然要高于互联网PM的水平。
  本人目前是一名互联网PM,刚好上学得是相关专业,有点数学底子,也层自己撸过代码设计实现基于BP前馈神经网络的图像识别,打算进入未来进入AI领域,最近开始重新学习并搭建AI的知识框架,希望能分享出来大家一起来了解AI这个看起来高大上的东西。
  首先,按照李笑来老师和罗胖的说法,学一个领域的知识,就是两件事(1)找概念(2)搭框架。特别是对于很多对概念都不了解的同学,一定要有个知识地图,如下:
  看到这个脑图,一些童鞋经常混淆的问题就明白了
  机器学习是什么
  深度学习是什么
  机器学习与深度学习的区别是什么
  机器学习监督学习方式的回归思想
  下面我们一一来说
  1。机器学习
  概念定义(个人理解):通过大量已知数据(可能被标注,也可能无标注)去训练算法模型,总结出某种数据之间的映射关系(即规律),最终可以对未知数据实现智能处理(分类、识别、预测等)
  举个例子,比如我这里有大量苹果和桃子的图片,并且每张图片都打上对应的种类标签,然后把这些图片喂给模型,让模型不断学习优化。训练结束后,我们又找一些没有打标签的苹果和桃子图片扔给这个模型,让他自己去做分类识别是苹果还是桃子,这就是一个完整的机器学习过程(有监督)。而所谓的映射关系,即苹果图片对应苹果标签,桃子图片对应桃子标签
  2。基本概念
  (1)学习方式
  学习方式分为有监督学习和无监督学习,有监督学习即我们会再把数据给模型训练之前,进行人工的预先处理,打标签(学名:特征提取)。监督学习又分为回归与分类。
  而无监督学习,就是无需通过人为的预先处理,直接把数据给算法,无监督学习对应的方法为聚类
  (2)学习过程
  训练集(训练样本):我们在训练算法模型时给他的数据
  验证集:用训练样本训练好以后,我们还要用训练样本之外的数据,去检验这个算法模型的实际效果
  误差:如何检验效果呢?在MLDL里,就是通过误差的大小去判断(至于具体怎么计算,下一篇会讲到)
  欠拟合:模型不能在训练集上获得足够低的误差
  过拟合:训练误差与测试误差(在验证集的误差)差距过大,那么这个模型就不是好模型,因为只能用在训练样本上。而对其以外的数据都没有好的效果
  泛化性:训练好的模型在其他数据上的使用情况,如果效果也很好,那就是泛化性好
  那么问题来了,怎样才算合适的拟合呢?
  其实在整个过程中,随着时间推移,算法的不断优化,在训练样本和测试样本的误差都在不断下降;但如果学习时间过程,训练集的误差持续下降,而验证集的误差却开始上升了。原因是模型为了在训练集上效果更好!已经开始学习训练集上的噪音和不需要的细节了。所以要找到合适的拟合,最好是找到训练误差还在下降,而测试误差刚好开始上升的那个点
  3。机器学习与深度学习的区别
  很多不知道的人,可能仅仅知道他们是包含关系,深度学习属于机器学习,但其实远远不止如此。。(这样太模糊了),从脑图可以看出,其实机器学习在方法上可以有很多种,比如:逻辑回归、决策树、朴素贝叶斯、线性回归、SVM支持向量机等,他们都属于机器学习,而我们也看到,最下面有一个神经网络,他们的等级与上面列举是属于一类的。
  而神经网络这概念,可以分为浅层神经网络与深层神经网络
  浅层神经网络中最经典的一个网络也就是BP前馈神经网络
  深层神经网络,大概可以理解为我们所谓的深度学习(DeepLearning),而深层神经网络,下面又分为很多网络结构,如DNN、CNN、RNN
  但这里要注意区分的是,深浅的区别不仅仅是网络层数的区别,更重要的是,深度学习(深层神经网络)较其他所有机器学习最厉害的一点:
  他可以进行数据的特征提取预处理(省去了数据人工标注的大麻烦,同时可以对更多维和复杂的特征进行向量的提取和空间向量的转换,方便后续处理),而这也是他为什么要很多层的原因,因为其中多出来的网络层数,都是要用来进行数据特征提取预处理的
  相信到一步,结合上面的脑图,我们就能分清机器学习与深度学习的真正区别了,不是简单的包含关系。
  4。回归
  个人觉得回归作为了解机器学习过程,是一个很好的入门了解。
  所谓回归,看起来很深奥,其实并不是这样。我举个栗子:
  y2x这个一元函数,假设我们现在不知道他的斜率w2,而我给你5数据y2,4,6,8,10,对应的x分别为1,2,3,4,5。你是不是会自动假设,那他们之间是2倍的对应关系?没错!你自动假设他们有某种对应关系的这个过程,就叫回归;而你假设他们的关系是2倍,这就是线性回归了。
  所以回归的定义(个人理解):我们看到大量事实或数据中,假设他们之间存在着某种对应关系。而机器学习中的回归(监督学习)要做的就是:尝试去让计算机找到大量数据之间这样的对应关系,那怎么找呢?
  我们先假设一个关系吧:ywxb,其中w为权值、b为偏置,w为1Xn矩阵向量,x为nX1的矩阵向量(这几个概念就不做数学解释了,而为什么x不是实数而是矩阵,那是因为我们在现实世界的数据中,可能有N多个维度。而不仅仅是一维就可以描述这个数据特征的)
  现在我要评判一个橘子的好坏程度,y代表好坏程度,而且都是打过标签的。x为一个三维矩阵向量分别代表【大小、颜色、形状】。那么代入公式:
  yw1X大小w2X颜色w3X形状b(这里先假设b为0吧)
  那么现在的任务就是分别找到合适的w1,w2,w3的值来准确描述橘子的好坏程度与大小、颜色、形状的关系。那么怎样确定是否合适呢?
  通过损失函数Loss来定义(这里数学公式就不列了),Loss的含义就是把样本中所有x都代入假设公式wxb中(这时候w与b的值几乎肯定是不准确的),然后得到值与真实的y值做比较的差值,就是损失函数Loss。那么Loss越小,说明这时候的w与b的值越接近真实的线性关系。所以我们最终机器学习的目的,就是求解出让Loss越小(当然无限接近于0最好)的对应的w与b的值,求出来之后,也就是机器学习模型训练结束!之后就是用验证集去验证是否会过拟合,来检验模型的泛化能力
  当然这里要做几点说明了:
  (1)这只是最为最为简单的一个机器学习栗子说明,着重了解一下机器学习中回归的基本思想
  (2)这里我们并没有说怎么去寻找让Loss最小(或符合条件)的对应w与b的映射关系,后面我在分享BP前馈神经网络的梯度下降时会简单介绍这个求解基本思想过程
  (3)如果你分析的数据本身是非线性关系,而你假设他们是线性关系并用对应的模型去训练,那么结果一定是欠拟合的(所以对于欠拟合的一另一个表达:你的想法不符合这个世界的现实)
  上面的关于机器学习的一些基本概念的分享,后续持续更新,希望能和大家一起走在AI的路上!
投诉 评论

如何画一个简单的飞翔的小鸟画飞翔的aclasstaghrefwiki10839IFDswYH3。html小鸟a,要画出向上拍动的翅膀、平平的尾巴、收起来的爪子,下面就来画飞翔的小鸟。工具材料……如何计算距离闪电有多远在本文中:计算与闪电的距离暴风雨就要来临,突然,你看到一道闪电,并伴随着轰隆隆的雷声,闪电和雷声的时间相差无几。如果你在一个安全的地方,计算出闪电与你的距离可以让你安心,……高考总分北大学霸自述数学不靠死学有人曾说:学数学就像一场没有硝烟的战争,抛下头颅、洒完热血,就直接被KO了。总之:对于很多孩子而言,数学不好学!即便如此,相信很多同学还是想要学好数学这门学科的,那……绿豆芽发苦还能吃吗绿豆芽发苦有毒吗图文豆芽主要分为绿豆芽和黄豆芽两种,夏天可以将绿豆芽凉拌来吃。绿豆芽不仅营养丰富,而且还有着清热解毒的作用。除此之外,绿豆芽的热量比较低,很适合想要减肥的人群食用。那么,绿豆芽发苦……公园里浓浓春的气息一一手机拍摄一近几天来,随着国内疫情得到控制,申城一大批公园逐步有条件地开园。让闷在家近两月的市民,在天气晴朗、阳光明媚中,到公园绿地去散步走走,呼吸呼吸清新的空气,享受春天的气息。我……产品之路机器学习一文章分享了关于机器学习的一些知识,希望能够给各位PM带来收获。2017年可以说是人工智能爆发的一年,传统互联网红利消失,熟知的大厂BAT都在人工智能上布局,作为一名互联网……免费看电影的网站都是千挑万选而来https:www。chapianyuan。com搜索结果会按照严格分类,分季整理,这点优于大多数视频网站;资源收录都是精选,收录BD1080P、WEB1080P、……霍山黄芽适合什么人喝喝霍山黄山的注意事项霍山黄芽外观金黄、汤色黄绿、叶底嫩黄的特点吸引了众多茶友,其口感更是香气宜人,最为特殊的就是霍山黄芽的香味,让人难以忘怀,霍山黄芽含有大量的茶多酚,有很高的营养价值,那么你知道……一棵黄杨剪年开口就是大价钱喜欢玩盆景的朋友应该都知道黄杨吧,黄杨可是盆景素材中的上等材料。黄杨号称千年矮,千年矮这个名字充分说明黄杨的生长速度十分缓慢。所以,在黄杨盆景中,树茎大的为数不多,可以说是寥寥……你生命中出现的每个人都在星盘里藏着呢包括灵魂伴侣我们都知道星座命盘中有着宫位,也知道每个宫位的意涵(不知道的读者们,可以点此查询你的星座命盘,获得12个宫位的详细解读),我们会对应每个行星在宫位里的含义,但是却不知道,宫位还……八字命局中的富贵格局一、富凡命局有如下情形者,皆主富。日主旺,财星为喜用神,有力而不遭破坏。日主强旺,逢旺财耗,或食伤旺泄。日主弱,比劫旺助,五行中和。木命,日主强旺,逢旺……你的恋人变心了吗想不想知道你的另一半是变心了呢?看看他的眼神就知道了,快来测试一下吧!【题目】请问对方的哪种眼神会让你爱上他?A、崇拜你,视你为偶像的眼神B、挑逗你、迷……
苹果手机怎么设置动态锁屏壁纸和添加声音天地之间的灵动那一刻我明白了刻在我心中的一次对话家风伴我成长我喜爱的小动物我学会了勇敢葡萄藤春天的声音自然中的一员失败的滋味座右铭大全爱情小雪节气养生食谱鹦鹉出壳多久开始进食我局意识形态工作总结浅析国际法上的权利冲突她是张一山的初恋,王子文的闺蜜,颜值秒杀一大票女明星未来的教室作文300字当五星红旗升起的时候木吉他2桃花源如何制作祈雨杖雨停之后再出发煤气中毒的预防措施

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找