SnailDove's blog

蜗牛哥博客


  • Home

  • About

  • Tags

  • Archives

  • Sitemap

  • Search

从特征工程到XGBoost参数调优

sticky | Posted on 2018-12-18 | In 中文
Words count in article 7.2k | Reading time ≈ 31
前言本文陈述脉络:理论结合kaggle上一个具体的比赛。 正文数据科学的一般流程 指南 特征工程 评价指标 XGBoost参数调优 XGBoost并行处理 特征工程结合以下案例分析: Two Sigma Connect: Rental Listing Inquiries 任务:根据公寓的listing 内容,预测纽约市某公寓租赁listing的受欢迎程度标签: interest_level,该 ...
Read more »

Tsinghua linear-algebra-2 3rd-lecture Singular-Values-Decomposition

sticky | Posted on 2017-08-03 | In 中文
Words count in article 1.1k | Reading time ≈ 4
前言笔记源自:清华大学公开课:线性代数2——第三讲:奇异值分解,本文将每一步推导都详细列出来了。 清华大学线性代数2公开课笔记总结 第1讲:正定矩阵第2讲:相似矩阵第3讲:奇异值分解第4讲:线性变换1第5讲:线性变换2第6讲:伪逆第7讲:工程中的矩阵第8讲:图与网络第9讲:Markov矩阵和正矩阵第10讲:Fourier级数第11讲:计算机图像第12讲:复数与复矩阵 正文对角矩阵是我们最喜欢的一类 ...
Read more »

极大化似然估计与贝叶斯估计区别

sticky | Posted on 2019-01-01 | In 中文
Words count in article 123 | Reading time ≈ 1
即使学了很久,很多人都没弄清楚极大化似然估计与贝叶斯估计区别,本文将简要概述一下区别,如果要详细搞清楚,建议食用MIT概率论教材《Introduction to probability》的第8, 9两章,本文只是简单总结和《统计学习方法》第4章——朴素贝叶斯方法中的例子。 正文下图摘录自教材《Introduction to probability》的第8章 参考 http://www.cn ...
Read more »

《统计学习方法》第4章 NaiveBayes

sticky | Posted on 2018-10-01 | In 中文
Words count in article 156 | Reading time ≈ 1
前言写本文章主要目的是复习(毕竟之前看纸质版做的笔记), 对于证明比较跳跃和勘误的地方我都做了注解,以便初学者和以后复习地时候快速阅读理解不会卡住。 朴素贝叶斯法 4.1 朴素贝叶斯法的学习与分类4.1.1 基本方法 4.1.2 后验概率最大化的含义 4.2 朴素贝叶斯法的参数估计4.2.1 极大似然估计 4.2.2 学习与分类算法 例子 4.2.3 贝叶斯估计 本章概要 习题
Read more »

《统计学习方法》第8章 提升方法之AdaBoost\BoostingTree\GBDT

sticky | Posted on 2018-10-01 | In 中文
Words count in article 4.4k | Reading time ≈ 15
前言在深度学习火起来之前,提升方法(包括AdaBoost, GBDT, XGBoost)是 kaggle 等比赛中的利器,所以提升方法 (boosting) 是必备的知识点。李航《统计学习方法》第8章——提升方法主要内容:AdaBoost, Boosting Tree, GBDT(这一块原文不够详细,将补充一些)。写本文主要目的是复习(毕竟之前看纸质版做的笔记), 对于证明比较跳跃和勘误的地方我都 ...
Read more »

《统计学习方法》第9章 EM/GMM/F-MM/GEM

sticky | Posted on 2018-10-01 | In 中文
Words count in article 3.6k | Reading time ≈ 17
前言EM(期望最大)算法有很多的应用,最广泛的就是混合高斯模型、聚类、HMM等等,本质上就是一种优化算法,不断迭代,获得优值,与梯度下降、牛顿法、共轭梯度法都起到同一类的作用。 本文是对李航《统计学习方法》的第9章复习总结,主要内容如下 EM(期望最大)算法证明有跳跃性的地方全部事无巨细地写出来, 在 三硬币例子解析 这一节将会把这个例子跟公式一一对应起来 GMM(高斯混合模型)迭代公式证明 ...
Read more »
<i class="fa fa-angle-left"></i>123…24<i class="fa fa-angle-right"></i>
SnailDove

SnailDove

keep enthusiasm

142 posts
3 categories
36 tags

Tag Cloud

  • Basic Algorithm1
  • Big Data1
  • Calculus and Differential1
  • Data Structure2
  • Distributed System2
  • Estimate1
  • Hadoop YARN2
  • Improving Deep Neural Networks7
  • Information Theory1
  • Latex1
  • Machine Learning27
  • Machine Learning by Andrew NG1
  • Machine Learning.feature engineering1
  • NLP1
  • Python Data Science Cookbook1
  • Redis1
  • Spark31
  • Structuring Machine Learning Projects3
  • XGBoost1
  • convolutional-neural-networks11
  • deep learning41
  • distributed compute1
  • distributed system1
  • distributed-system1
  • english1
  • google1
  • hexo1
  • java1
  • kaggle1
  • linear_algebra13
  • linux1
  • neural-networks-deep-learning8
  • nlp-sequence-models11
  • papers1
  • probability13
  • 统计学习方法4
RSS
E-Mail Weibo
Links
  • Linear Algebra on MIT
  • Probability-and-statistics on MIT
© 2018 — 2023 SnailDove | Site words total count 929.1k
Visitors Total hits
0%