机器学习

我们身边的机器学习小应用

前几天写了《请不要把机器学习和数据分析混为一谈》这一篇小文,很多对机器学习感兴趣的伙伴发来私信问我:整天说机器学习,那么机器学习到底应用在哪呀?其实,机器学习的应用实在是太过于广泛,所以说,我希望通过今天的这篇小文章来和大家共同分享下机器学习的几个典型应用。看看机器学习是如何渗透到我们生活的方方面面,影响到我们的衣食住行的。最早的也是最著名的一个案例呢,就是“啤酒+纸尿裤”

使用kNN算法实现简单的手写文字识别

0. 介绍kNN,即k-Nearest Neighbor(k近邻算法), 简介可参考KNN的一些总结. 本文是《机器学习实战》一书第二章的例子, 主要利用kNN实现简单的手写文字识别.书中使用Python实现, 本文是使用R语言. 数据集中的图片分辨率为32*32, 并且该数据已经预处理成文本文件, 即类似点阵字体, 使用1代表有文字的像素, 0表示空白.1. kNN算法实

UFLDL 学习笔记

前言最近开始看Andrew Ng 大牛的深度学习教程,算是作为对自己的一个激励,也作为日后回顾的办法,开始记录学习笔记,每一章节分别对应,所有章节写在这一片文章里便于查询。所以我会不断更新滴~线性回归本章大致讲解了线性分类器的原理(他假设我们已经有这些基础了,只是作为复习梯度下降的一个办法,其实能看这些教程的都应该有机器学习的基础知识,所以有好多基础知识我就直接省略不写啦)

机器学习从入门到放弃之逻辑回归

分类问题回到本系列的第一篇文章机器学习从入门到放弃之KNN算法,在里面有这样的一个问题黄点代表1类电影的分布,绿色代表0类电影的分布,紫色代表需要分类的电影样本。那么该怎么判别紫色的那颗点所在的类别呢?之前给出的是KNN算法,通过计算紫色点都周边的剧场的长短,来判断紫色点属于哪个类别。现在有这样一种极端情况,黄点和绿点在紫点周围呈圆周分布,距离一样,咋办?图画得不是太好,大

机器学习算法经验总结

看到一篇很好的介绍机器学习算法的文章,转载过来,有这方面学习、研究的朋友可以看看。算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果。其实整个人工

携程:机器学习在酒店服务领域的实践

编者注:在携程技术中心推出的线上公开课程[携程技术微分享]上,来自携程酒店研发的BI经理潘鹏举,介绍了如何借助大数据和算法,通过机器学习去克服酒店服务行业挑战,给用户带来更好的服务体验,给公司带来效率提升,希望能对你有所启发。关注携程技术中心微信号(ctriptech),回复“微分享”,可获得[携程技术微分享]最新课程信息。不同于其他行业,酒店OTA有一些自己的特点,比如天

推荐系统技术文本相似性计算(三)实战篇

前两篇可以直接看我的专栏或者文本相似性计算(一)文本相似性计算(二)前面说了两篇了,分别介绍了TFIDF和向量空间的相关东西,然后介绍了主题模型,这一篇我们就来试试这两个东西。词向量就不在这篇试了,词向量和这两个关系不大,不好对比,不过我最后也给出了代码。0. 工具准备工欲善其事,必先利其器,那么我们先来利其器,这里我们使用的是python的gensim工具包,地址是:ht

搞机器学习要哪些技能

今天文章比较轻松,不涉及技术,前天抢了两张张学友的演唱会门票,很开森~~~在SF这充满90后的地盘暴露年龄了。。。1. 前言本来这篇标题我想的是算法工程师的技能,但是我觉得要是加上机器学习在标题上,估计点的人会多一点,所以标题成这样了,呵呵,而且被搜索引擎收录的时候多了一个时下的热门词,估计曝光也会更多点。不过放心,文章没有偏题,我们来说正经的。今天就说说机器学习这个最近两

机器学习-01-K-临近算法学习

K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法。其中的K表示最接近自己的K个数据样本。KNN算法和K-Means算法不同的是,K-Means算法用来聚类,用来判断哪些东西是一个比较相近的类型,而KNN算法是用来做归类的,也就是说,有一个样本空间里的样本分成很几个类型,然后,给定一

验证码破解技术三部曲之环境搭建篇

前言转眼就要变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。 以下是我破解的几种验证码。1、最容易破解的验证码直接使用tesseract库识别。2、download.csdn的验证码使用K近邻算法识别。3、weibo.