“黑中有白,白中有黑,没有绝对的白,也没有绝对的黑,黑可衬白,白可映黑。万物皆可转换”。

本文是笔者首篇关于异常检测类的文章,主要介绍了八种不同的无监督异常检测方法,篇幅较长,实验部分仅供参考。全文表述中如有不明之处,读者可在下方留言。

Read More »

首先说明一下,本主题源自Hexo Next主题,经过笔者长期以来的修改,源代码中很多地方都有所变动,因此衍生出一个新的花名FreeSky,目前版本为FreeSky v0.4.0,GitHub地址:csuldw/FreeSky。起初博主并没有意料到会有其他人也使用这一主题,毕竟修改的地方有点多,而且略微粗糙,没有去仔细修正,适合自用。最近在浏览GitHub的时候,看到用户ooobug提了一个issue,这也让我开始怀疑,这个BUG是否已经存在很久了。

Read More »

“学而时习之,不亦说乎”,趁着过年几天假期,多写几篇文章。上一篇文章基于Embedding的推荐系统召回策略介绍的是一种召回方法,本文将介绍一种用于推荐系统排序阶段的方法FM,全称Factorization Machines,该算法的目的是解决稀疏数据下的特征组合问题,被广泛应用于广告推荐等CTR预估场景。关于FM算法的介绍数不胜数,读者也可以去阅读paper。本文纯粹是笔者实践过程中的个人总结,内容简要浅显,不敢与其他行家媲美,如若读者在阅读过程中发现疑问,还请留言告知,谢谢!

Read More »

推荐系统主要试图预测user对item的评分或是偏好,通过评分的高低进行针对性的推荐。纵观各互联网大公司,几乎都会采用使用到推荐服务,比如:新闻推荐、广告推荐、商品推荐、书籍推荐等等。本文主要介绍如何使用keras训练embedding weights进而进行推荐。

Read More »

最近,在浏览towardsdatascience上面的机器学习相关文章的时候,无意间看到一篇关于异常检测的文章,刚好与自己的工作内容有点契合,文章讲解的是两种分析思路:第一种、PCA + Mahalanobis;第二种、AutoEncoder训练模型进行检测。兴奋之下,决定将这篇文章分享出来,如果内容有理解不当的地方,还请读者指出,深表感谢。

原文链接: How to use machine learning for anomaly detection and condition monitoring

Read More »




前阵子,丫姐说18年快过了,看你以前每年都写总结,今年的总结什么时候写,写完告诉我,我去看看!

的确,一年又要过了。从读研那年起,就开始写年总结,久而久之,便成了一种习惯。记得还是14年的时候,少不经事,懵懵懂懂,写的内容也是东拼西凑,词不尽意,流水般的记录下自己一年的“奇葩”经历,犹如游记一般。现如今,五年过去了,虽然这两年没怎么写博文,但年度总结终归还是不能落下,毕竟,过了今天,又是一年呢!

Read More »

在上一篇Deep Learning - CNN原理剖析一文中介绍了卷积神经网络,CNN的层次框架是输入层、卷积层、ReLU层、Pooling层、FC全连接层,其两大主要特性是:局部感知和权值共享。在应用上,CNN主要用于图像分析,然而对于存在上下文关系或是时序特性的场景,如NLP、语音识别等,CCN则表现得很无力。由此便出现了另一种神经网络结构——RNN(Recurrent Neural Networks,循环神经网络)。

Read More »

在前面的Perceptron - 原理与实现一文中介绍了神经网络的基础算法,通过该文我们初步了解了感知机的原理以及实现。本文将介绍神经网络以及训练网络使用的Backpropagation(反向传播)算法,进一步为学习深度学习打好基础。阅读之前,先说明一下,由于推导过程公式较多,在编辑过程中可能出现个别差错,如有读者发现存在纰漏,还请E-mail告知,多谢!

Read More »

背景介绍

上一篇文章中已经介绍过读写分离,并且通过代码也已实现局部的读写分离。为什么说是局部的呢?首先,来分析下,针对上一篇文章中提到的方法,如果在service层没有配置事务,那么当程序走到Dao层时,就可以根据自己定义的规则进行读写分离;倘若在service层配置了事物,那么在Dao切换数据库key的时候,是无法正真的进行读写分离的。因此,通过进一步的研究和尝试,找到了一种新的方法来实现真正意义上的Dao层读写分离,该方法可以在事务内部直接切换数据库,达到读写分库的功能。

Read More »

背景介绍

通常,在与数据库进行交互时,对数据库的操作都是“读多写少”,一方面,对数据库读取数据的压力比较大;另一方面,如果数据库分布在国内,那么在国外访问项目的时候,如果查询的接口较多,那么直接访问国内的数据库会大大的降低访问性能。因此,为了提升数据访问速度,缓解数据库的压力,我们可以在国外的服务器也安装一个mysql,部署一个项目,两个mysql进行主从配置,那么对于接口就需要采用读写分离策略,其基本思想是:将数据库分为主库和从库,主库只有一个,从库可有多个,主库主要负责写入数据,而从库则负责读取数据。

Read More »

回顾了下以前的博文,发现自己CSDN博客里面有的博文没有同步到这里来。出于温故知新的目的,打算将perceptron引入至此,并在原来的基础上稍作更改,下面请看正文。

Read More »

17年的总结,来的比往年晚了一些。记忆中还在回望着二零一六年十二月的点点滴滴,而如今又是一年。每年的总结,都夹带着一些伤感,今年似乎也不例外。

Read More »




『一张温馨图片,献给金秋九月.』

时隔大半年,回头看着这停滞不前的博客,心里忐忑不安,久久不平。上半年一直在为毕业忙碌,毕业之后进入工作状态,业余时间也就少了很多了。以前在学校的时候,很自由,能够腾出来写博客的实践是一大把,毕竟时间都是自己安排,能够充分地利用。如今进入公司,就不能这么随性了。所以,对于现在这个状态的自己,还是要好好计划好,工作肯定是不能耽误的,当然自己的博客也不能荒废了。

Read More »