sklearn梯度提升树基本操作

2018年11月22日 0 条评论 21 次阅读 0 人点赞

  1.梯度提升决策树 什么是决策树 维基百科:决策树(Decision Tree)是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。数据挖掘中决策…

机器学习分享

2018年11月20日 0 条评论 28 次阅读 0 人点赞

  什么是机器学习 让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好 通俗来讲,让代码学着干活     机器学习 ≈寻找一个函数         一些基本的概念 特征:自变量 标签:…

进程的一些概念-父亲进程、子进程、僵尸进程、孤儿进程

2018年9月12日 0 条评论 79 次阅读 0 人点赞

  进程有这么多的种类,那么进程之间定是有相关性的,而这些有关联性的进程又是如何产生的,如何衍生的? 就比如我们启动了终端,就是启动了一个 bash 进程,我们可以在 bash 中再输入 bash 则会再启动一个 bash 的进程,此时第二个 bash 进程就是由第一个 bash 进程创建…

数据库锁:乐观锁和悲观锁,共享锁和排它锁,行级锁和表级锁

2018年9月11日 0 条评论 71 次阅读 0 人点赞

一、悲观锁和乐观锁 我们经常在开发中遇到数据库并发处理时,处理不一致的问题。需要对程序做并发控制。 典型的并发时出现的冲突有两种: 1、丢失更新:一个事务的更新覆盖了其它事务的更新结果,就是所谓的更新丢失。 例如X=0  A1把X=X+1  A2也设置X=X+1    如果A1和A2同时执行,可能出…

IJCAI阿里妈妈搜索广告转化预测

2018年9月10日 0 条评论 90 次阅读 0 人点赞

思想流程回顾 1.数据分析 使用pandas、seaborn对数据进行分析及可视化处理,更容易得到特征与特征及特征和label间的关系。统计及可视特征为item、user、时间点分布等。 2.数据清洗 (1)缺失数据处理 数据中存在大量缺失值,以-1标注(赛题已给出)。对于连续变量中的缺失值,采用均…

python中的反射

2018年9月2日 0 条评论 86 次阅读 0 人点赞

把反射的坑填上 对于熟悉Java的程序员,一定经常和Class.forName打交道。Java的众多框架中,如Spring,eclipse plugin机制等很多都依赖于Java的反射技术。感觉反射在Java中属于比较高级的技术,通常作为高级主题来讲述。 但是在Python中反射比java中简单得多…

秋招面经-后端开发

2018年8月29日 0 条评论 121 次阅读 1 人点赞

一、计算机网络 基础部分 TCP报头格式 UDP报头格式 TCP/UDP区别(不仅是宏观上的,最好能根据各自的机制讲解清楚) HTTP状态码(最好结合使用场景,比如在缓存命中时使用哪个) HTTP协议(一些报头字段的作用,如cace-control、keep-alive) OSI协议、TCP/IP协…

imdb_CNN_LSTM

2018年5月17日 0 条评论 198 次阅读 0 人点赞

    一、数据集简介   1.背景描述 电影上映之前,我们怎样得知它的好坏呢?这个问题很难回答,因为并没有一个普适的方法来判定电影的好坏。许多人依靠评分来测量一个电影质量的好坏,而另一些人则凭他们的直觉。但在电影上映后也需要时间来获取一个合理数量的评分反馈。同时,人们…

MPI入门

2018年5月8日 0 条评论 0 次阅读 0 人点赞

1.什么是MPI MPI是一个跨语言的通讯协议,用于编写并行计算机。支持点对点和广播。MPI是一个信息传递应用程序接口,包括协议和和语义说明,他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能,大规模性,和可移植性。MPI在今天仍为高性能计算的主要模型。 主要的MPI-1模型不包括共享内存概…

word2vec词向量训练及gensim的使用

2018年4月25日 0 条评论 362 次阅读 0 人点赞

一、什么是词向量 词向量最初是用one-hot represention表征的,也就是向量中每一个元素都关联着词库中的一个单词,指定词的向量表示为:其在向量中对应的元素设置为1,其他的元素设置为0。采用这种表示无法对词向量做比较,后来就出现了分布式表征。 在word2vec中就是采用分布式表征,在向…

加载更多