本文介绍python中的进程与线程的概念,以及如何编写多进程与多线程的代码。
特征选择与稀疏学习
在机器学习的理论学习中,我们经常过于关注模型,而忽略了其他的一些问题。在实际的机器学习问题中,选择一个好的特征可能和使用一个好的模型一样重要,甚至特征的选择会直接影响最后模型的结果。本文介绍机器学习中的特征选择与稀疏学习。
python协程、asyncio、异步编程
异步编程在在编程中越来越常见,特别是在python3支持异步编程之后,越来越多的框架也开始支持异步编程,例如tornado、fastapi、django 3.x asgi等。正确使用异步编程可以提升计算性能。
我们从协程的概念、asyncio异步编程模块的实战案例三个方面介绍python的异步编程。
K-means
K-means是常见的无监督聚类算法,其中k是用户指定的要创建簇的数目。该方法k个随机的质心开始,算法会计算每个点到质心的距离,每个点会被分配到距其最近的簇质心,然后接着基于新分配到的点更新簇质心。
本文介绍该算法的原理以及代码实现。
排序算法
本文介绍常见的排序算法以及简单的应用。
图论
本篇文章记录了图的基本知识,图的邻接表表示,深度优先和广度优先遍历,并查集,拓扑排序,最小生成树问题,单源最短路径问题。所有的数据结构和算法都用python语言实现。
XGBoost——贰
本文介绍如何使用XGboost预测是否患有心脏病,涉及的数据有数值型和类别型。最后,使用了sklearn的自动超参数优化方法,寻找最优的超参数。
XGBoost——壹
CART模型与实现
对于连续型数据,CART采用二元分割的方法构建树,用平方误差的总和(即y的方差乘样本数)来度量混乱度。本文采用Numpy手动实现CART模型,包括预剪枝和后剪枝。
CART算法是树模型的经典算法,可以用于构建二元树并处理离散或者连续型数据的切分,如果采用不同的误差准则,就可以通过CART来构建模型树和回归树。回归树指的是叶子节点使用的分段常数,模型树指的是叶子节点使用线性回归方程。本文采用Numpy手动实现CART模型,构建模型树和回归树,以及预剪枝和后剪枝,参考自《机器学习实战》第九章。
使用hexo与github搭建个人网页
本文介绍如何搭建个人博客平台,使用的工具是Hexo框架和Github。