Files
Obsidian/Spaces/000-Task/全栈工程师.md

67 KiB
Raw Blame History

atlas, completed, created, incomplete, modified, tags, title, total
atlas completed created incomplete modified tags title total
Task Tracker 65 2023-07-08 03:18:59 1935 2024-04-20 23:31:51
Task
全栈工程师 2000

GitHub

尚硅谷 git 快速入门

  • 教程简介 2023-09-14
  • 为什么学习 Git 软件 2023-09-14
  • 版本控制 2023-09-14
  • 版本控制软件基础功能 2023-09-14
  • 集中式、分布式版本控制软件 2023-09-14
  • Git 安装 2023-09-20
  • GitHub Desktop - 介绍 2023-09-20
  • GitHub Desktop - 仓库操作 2023-09-20
  • GitHub Desktop - 文件操作 2023-09-20
  • GitHub Desktop - 分支原理 2023-09-20
  • GitHub Desktop - 分支操作 2023-09-20
  • GitHub Desktop - 标签 2023-09-20
  • GitHub Desktop - 远程仓库 GitHub 2023-09-20
  • GitHub Desktop - 远程仓库 Gitee 2023-09-20
  • GitHub Desktop - README, IGNORE 2023-09-20
  • GitHub Desktop - 文件图标和比对功能 2023-09-20
  • IDEA 集成 - GitHub 2023-09-20
  • IDEA 集成 - Gitee 2023-09-20
  • 版本号 - 介绍 2023-09-20
  • 版本号 - 文件操作 2023-09-20
  • 版本号 - 分支操作 2023-09-20
  • 命令 - 介绍 2023-09-20
  • 命令 - 仓库操作 2023-09-20
  • 命令 - 文件操作 2023-09-20
  • 命令 - 文件操作误删除 2023-09-20
  • 命令 - 分支操作 2023-09-20
  • 命令 - 分支操作合并和冲突 2023-09-20
  • 命令 - 标签操作 2023-09-20
  • 命令 - 远程仓库 2023-09-20
  • 搭建自己的代码托管平台 GitLab 2023-09-20
  • 总结 2023-09-20

韩顺平 GitHub 教程

  • 课程内容 2023-09-11
  • 创建仓库 2023-09-11
  • 上传网站 2023-09-11
  • 顶级域名 2023-09-11
  • 项目结构 2023-09-11
  • 版本比较 2023-09-11
  • issues pull action 2023-09-11
  • 项目板 2023-09-11
  • 项目设置 2023-09-11

Python

Python for everybody

人人都会编程

为什么要编程

  • 欢迎来到 Python
  • 为什么要编程
  • 硬件概述
  • Python 作为一种语言
  • 编写代码段落
  • 演示:完成 "Hello World" 作业

变量和表达式

  • 表达式1
  • 表达式2
  • 表达式3
  • 练习

条件代码

  • 条件语句
  • 更多条件语句
  • 练习

函数

  • 使用函数
  • 构造函数

循环与迭代

  • 循环和迭代
  • 确定循环
  • 找出最大值
  • 循环语句
  • 练习

Python 数据结构

字符串

  • 字符串
  • 操作字符串
  • 练习

文件

  • 文件
  • 处理文件
  • 练习

列表

  • 列表
  • 操作列表
  • 列表和字符串
  • 练习

字典

  • 字典
  • 用字典计数
  • 字典和文件
  • 练习

元组

  • 元组
  • 练习

使用 Python 访问 Web 数据

正则表达式

  • 正则表达式
  • 提取数据

网络和套接字

  • 网络化技术
  • 超文本传输协议HTTP
  • 示例:套接字
  • 使用开发者控制台探索HTTP

网上冲浪程序

  • Unicode 字符和字符串
  • 检索网页
  • 示例:使用 Urllib
  • 解析网页
  • 示例:使用 beautifulsoap

网络服务和 XML

  • 网络数据
  • 可扩展标记语言XML
  • XML Schema
  • 解析 XML
  • 示例XML

JSON 和 REST 架构

  • JavaScript 对象符号JSON
  • 示例JSON
  • 面向服务法
  • 面向服务的架构
  • 使用应用程序接口
  • 示例GroJSON API
  • 安全 API 请求
  • 示例Twitter API

使用 Python 操作数据库

面向对象的 Python

  • 面向对象的定义和术语
  • 我们的第一个类和对象
  • 对象生命周期
  • 对象继承

基础结构化查询语言

  • 关系型数据库
  • 使用数据库
  • 单表 CRUD
  • 示例:计算数据库中的电子邮件

数据模型和关系型 SQL

  • 设计数据模型
  • 用表格表示数据模型
  • 插入管信息数据
  • 使用 JOIN 重构数据
  • 示例Tracks.py

SQL 中的多对多关系

  • 多对多关系
  • 示例roster.py
  • 示例Twfriends. py

数据库和可视化

  • 地理编码
  • 地理编码可视化
  • 示例:地理数据

使用 Python 检索、处理和可视化数据

建立搜索引擎

  • 网页排名概述
  • 示例:网页排名-爬虫
  • 示例:网页排名-计算
  • 示例:网页排名-可视化

搜索和模拟电子邮件数据

  • Gmane 简介
  • 示例:邮件检索
  • 示例:邮件模型

电子邮件数据可视化

  • 示例:邮件可视化

黑马程序员

  • 初识 python 2024-04-20
  • 什么是编程语言 2024-04-20
  • Python 环境安装 2024-04-20
  • 第一个 Python 程序 - Hello World 2024-04-20
  • 第一个 Python 程序 - 练习讲解 2024-04-20
  • 第一个 Python 程序 - 常见问题解答 2024-04-20
  • Python 解释器 2024-04-20
  • PyCharm 开发工具的安装和基础使用 2024-04-20
  • PyCharm 的基础使用 2024-04-20
  • 第一章重点内容回顾 2024-04-20
  • 字面量 2024-04-20
  • 注释 2024-04-20
  • 变量 2024-04-20
  • 数据类型 2024-04-20
  • 数据类型转换 2024-04-20
  • 标识符 2024-04-20
  • 运算符 2024-04-20
  • 字符串的三种定义方式 2024-04-20
  • 字符串的拼接 2024-04-20
  • 字符串的格式化 2024-04-20
  • 字符串格式化的精度控制 2024-04-20
  • 字符串格式化的方式 2 2024-04-20
  • 对表达式进行格式化 2024-04-20
  • 字符串格式化练习题讲解 2024-04-20
  • 数据输入input 语句) 2024-04-20
  • 布尔类型和比较运算符
  • if 语句的基本格式
  • 【案例】成年人判断讲解
  • if else 组合判断语句
  • 【案例】我要买票吗讲解
  • if elif else 组合使用的语法
  • 【案例】猜猜心里数字讲解
  • 判断语句的嵌套
  • 判断语句综合案例
  • while 循环的基础应用
  • 【案例】求 1-100 的和讲解
  • while 循环猜数字案例
  • while 循环的嵌套应用
  • 【案例】九九乘法表
  • for 循环的基础语法
  • 【案例】数一数多少字母 a 详解
  • range 语句
  • for 循环临时变量作用域
  • for 循环的嵌套使用
  • for 循环打印九九乘法表
  • continue 和 break
  • 循环综合案例
  • 函数的初体验
  • 函数的基础定义语法
  • 函数基础定义练习案例
  • 函数的传入参数
  • 函数的参数练习案例
  • 函数的返回值自定义语法
  • 函数返回值之 None 类型
  • 函数的说明文档
  • 函数的嵌套调用
  • 变量在函数中的作用域
  • 函数综合案例
  • 数据容器入门
  • 列表的定义语法
  • 列表的下标索引
  • 列表的常用操作方法
  • 列表的常用操作课后练习讲解
  • 列表的循环遍历
  • 元组的定义和操作
  • 字符串的定义和操作
  • 字符串的课后练习讲解
  • 数据容器(序列)的切片
  • 序列的切片课后练习讲解
  • 集合的定义和操作
  • 集合的课后练习
  • 字典的定义
  • 字典的常用操作
  • 字典课后联系讲解
  • 五类数据容器的总结对比
  • 数据容器的通用操作
  • 字符串大小比较的方式
  • 函数的多返回值
  • 函数的多种参数使用形式
  • 函数作为参数传递
  • lambda 匿名函数
  • 文件编码概念
  • 文件的读取操作
  • 文件读取的课后练习讲解
  • 文件的写出操作
  • 文件的追加写入操作
  • 文件操作的综合案例
  • 了解异常
  • 异常的捕获
  • 异常的传递性
  • 模块的概念和导入
  • 自定义模块并导入
  • 自定义 Python 包
  • 安装第三方包
  • 异常、模块、包综合案例讲解
  • 案例介绍
  • JSON 数据格式的转换
  • pyecharts 的入门使用
  • 数据准备
  • 生成折线图
  • 数据可视化案例 - 地图
  • 全国疫情地图构建
  • 河南省疫情地图绘制
  • 基础柱状图构建
  • 基础时间线柱状图绘制
  • 动态 GDP 柱状图绘制
  • 初识对象
  • 类的成员方法
  • 类和对象
  • 构造方法
  • 魔术方法
  • 封装
  • 封装的课后练习题讲解
  • 继承的基础语法
  • 复写父类成员和调用父类成员
  • 变量的类型注解
  • 函数和方法类型注解
  • Union 联合类型注解
  • 多态
  • 数据分析案例步骤 1 文件读取
  • 数据分析案例步骤 2 数据计算
  • 数据分析案例步骤 3 可视化开发
  • SQL 章节前言
  • 数据库介绍
  • MySQL 安装
  • MySQL 的入门使用
  • SQL 基础和 DDL
  • SQL - DQL - 基础查询
  • SQL - DQL - 分组聚合
  • SQL - DQL - 排序分页
  • Python 操作 MySQL 基础使用
  • Python 操作 MySQL 数据插入
  • 综合案例
  • PySpark 实战前言介绍
  • 基础准备
  • 数据输入
  • 数据计算 - map 方法
  • 数据计算 - flatmap 方法
  • 数据计算 - reducebykey 方法
  • 数据计算 - 练习案例 1
  • 数据计算 - filter 方法
  • 数据计算 - distinct 方法
  • 数据计算 - sortby 方法
  • 数据计算 - 练习案例 2
  • 数据输出 - 输出为 Python 对象
  • 数据输出 - 输出到文件中
  • 综合案例
  • 大数据分布式集群运行综合案例代码
  • 闭包
  • 装饰器
  • 设计模式 - 单例模式
  • 设计模式 - 工厂模式
  • 多线程并行执行概念
  • 多线程编程
  • Socket 服务端开发
  • Socket 客户端开发
  • 正则表达式 - 基础方法
  • 正则表达式 - 元字符匹配
  • 递归

爬虫

Genji

  • 课程介绍
  • 快速易懂 Python 入门
  • 爬虫的流程?从入门到入狱?
  • 什么是 HTTP 请求和相应?
  • 如何用 Python Requests 发送请求
  • 如何用 Python Requests 拿到豆瓣源码
  • 什么是 HTML 网页结构
  • HTML 有哪些常见标签
  • 练习 HTML 常见标签
  • 如何用 Beautiful Soup 解析 HTML 内容
  • 从源码获取豆瓣电影 TOP250
  • 下一步是什么?

数据分析

Google 数据分析

基础:无处不在的数据

介绍数据分析和分析思维

  • 欢迎
  • 课程介绍
  • 日常生活中的数据分析
  • 数据分析的维度
  • 什么是数据生态系统
  • 数据如何帮助做出更好的决策
  • 发现数据技能集
  • 数据分析师的关键技能
  • 关于分析思维
  • 探索核心分析技能
  • 数据驱动成功结果
  • 见证数据魔术
  • 接下来会发生什么

数据的精彩世界

  • 了解数据阶段和工具
  • 数据生命周期的各个阶段
  • 六个数据分析阶段
  • 数据分析过程示例
  • 探索数据分析师工具

建立数据分析工具箱

  • 核心数据工具的来龙去脉
  • 让电子表格成为你的朋友
  • SQL 的实际应用
  • 每天学习新技能都面临困难
  • 成为数据可视化专家
  • 数据可视化的力量

成为公平且有影响力的数据专家

  • 言归正传
  • 数据分析师的工作
  • 成为数据分析师的道路
  • 支持数据分析领域的职业发展
  • 数据在商业中的力量
  • 数据侦探
  • 了解数据和公平
  • 公平和合乎道德的数据决策
  • 不同行业的数据分析师
  • 面试最佳做法
  • 课程小结

提出问题以做出数据驱动的决策

提出有效问题

  • 解决问题和有效提问的入门
  • 实际应用中的数据
  • 数据处理流程
  • 常见问题类型
  • 继续探索业务应用
  • 从假设到结果
  • 明智的问题
  • 数据开启大门

做出数据驱动的决策

  • 数据和决策
  • 数据如何赋能决策
  • 定性和定量数据
  • 分享您的发现
  • 数据与指标
  • 数学思维

电子表格的魔力

  • 令人惊叹的电子表格
  • 开始使用电子表格
  • 基本电子表格任务
  • 成功公式
  • 函数 101
  • 解决问题之前先理解它
  • 工作范围和结构化思维
  • 保持客观

永远记住利益相关者

  • 与你的团队保持沟通
  • 平衡团队的需求和期望
  • 专注于重要的事情
  • 清晰的沟通是关键
  • 有效沟通技巧
  • 在项目目标间平衡期望值和现实
  • 如何与利益相关者沟通
  • 数据权衡:速度与准确性
  • 思考你的流程和产出
  • 满足最佳实践
  • 加入新团队
  • 从冲突到合作
  • 来自美国海军陆战队的数据分析
  • 课程小结

为探索准备数据

数据类型和结构

  • 数据探索入门
  • 令人着迷的数据洞察力
  • 我们世界的数据收集
  • 确定要收集什么数据
  • 探索数据格式
  • 继续探索结构化数据
  • 了解你正在使用的数据类型
  • 数据表组件
  • 满足宽表和长表

数据可靠性

  • 偏见、可信度、隐私和道德入门
  • 偏差:从问题到结论
  • 有偏差和无偏差的数据
  • 了解数据中的偏差
  • 确定好的数据源
  • 什么是坏数据
  • 基本数据伦理
  • 数据伦理的重要性
  • 优先考虑数据隐私
  • 合乎道德地使用数据
  • 开放数据的特点
  • 合乎道德的数据使用步骤

数据库要点

  • 关于数据库的一切
  • 数据库特性和组件
  • 揭开元数据的神秘面纱
  • 用元数据管理数据
  • 元数据的乐趣
  • 这么多地方可以找到数据
  • 从电子表格和数据库导入数据
  • 排序和过滤,以集中处理相关数据
  • 了解 BigQuery包括沙盒和计费选项
  • BigQuery 实际应用

整理和保护数据

  • 对你的数据充满信心
  • 让我们整理起来
  • 电子表格中的安全功能

参与数据社区

  • 管理您作为数据分析师的存在
  • 为什么在线展示很重要
  • 提升在线形象的技巧
  • 网络知识
  • 导师制的好处
  • 导师是关键
  • 课程小结

从脏数据到干净数据的处理

数据完整性的重要性

  • 数据完整性入门
  • 为什么数据完整性很重要
  • 平衡目标与数据完整性
  • 处理不足的数据
  • 样本量的重要性
  • 使用统计能力
  • 确定最佳样本量
  • 评估数据完整性

清洗数据以获得更准确的洞察力

  • 清洗
  • 为什么数据清洗至关重要
  • 我喜欢清洗数据
  • 识别并修复脏数据
  • 数据清洗工具和技术
  • 清洗来自多个来源的数据
  • 电子表格中的数据清洗功能
  • 优化数据清洗流程
  • 不同的数据视角
  • 更多数据清洗技术

使用 SQL 进行数据清洗

  • 使用 SQL 进行数据清洗
  • 对 SQL 的热爱
  • 理解 SQL 的功能
  • 电子表格与 SQL
  • 广泛使用的 SQL 查询
  • 体验 SQL 的乐趣
  • 使用 SQL 清洗字符串变量
  • 高级数据清洗函数1
  • 高级数据清洗函数2

核实与报告清洁结果

  • 核实与报告结果
  • 确认数据清洗符合业务预期
  • 核实数据清洗
  • 捕捉清洗变化
  • 为什么文档很重要
  • 反馈和清洗

添加数据到你的简历中

  • 关于数据分析师招聘流程
  • 数据分析师职位申请
  • 制作简历
  • 使你的简历独一无二
  • 黑人和非裔美国人融入数据行业
  • 翻译过去的工作经验
  • 我的数据分析师之路
  • 你的兴趣在哪里
  • 课程小结

分析数据回答问题

整理数据以进行更有效的分析

  • 整理入门
  • 分析过程
  • 坚持不懈
  • 总是需要整理
  • 使用 SQL 筛选数据
  • 对电子表格中的数据进行排序
  • 在电子表格中使用排序函数
  • 有意义的职业之旅
  • 使用 SQL 排序数据

格式化和调整数据

  • 数据格式化入门
  • 从一种类型到另一种类型
  • 数据验证
  • 条件格式化
  • 合并文本字符串以获得洞察力
  • 电子表格中的字符串
  • 当你陷入困境时
  • 关于分析阶段的一切
  • 遇到挑战不用担心
  • 何时使用哪种工具

汇总分析数据

  • 汇总数据进行分析
  • 准备 VLOOKUP
  • VLOOKUP 的实际应用
  • 识别并修复常见的 VLOOKUP 错误
  • 探索 JOIN 的如何运作
  • 嵌套查询
  • 使用子查询汇总数据
  • 数据分析带您去往何处

执行数据计算

  • 数据计算
  • 常用计算公式
  • 函数和条件
  • 复合函数
  • 开始使用数据透视表
  • 数据透视表续
  • 查询与计算
  • 在 SQL 中嵌入简单计算
  • 与其他语句的计算
  • 检查和重新检查
  • 临时表
  • 多表变体
  • 课程小结

通过可视化艺术共享数据

数据可视化

  • 数据洞察交流入门
  • 数据可视化的力量
  • 数据可视化为何重要
  • 连接图像与数据
  • 强大可视化的秘诀
  • 动态可视化
  • 艺术元素
  • 数据可视化的影响
  • 设计思维和可视化
  • 无障碍可视化
  • 让数据易于访问

使用 Tablesu 创建数据可视化

  • 使用 Tablesu 进行数据可视化
  • Tableau Public 和其他在线工具
  • 了解 Tableau
  • 在 Tableau 中创建数据可视化
  • 优化数据可视化的调色板
  • 发挥创意
  • 在 Tableau 中链接多个数据集

制作数据故事

  • 制作数据故事
  • 将想法变为现实
  • 与观众交谈
  • 数据新闻
  • Tableau 仪表盘基础知识
  • 从过滤器到图表
  • 引人入胜的演示技巧
  • 分享叙述
  • 如何应对冒名顶替综合症

制作演示文稿和幻灯片

  • 把各种数据组合起来
  • 使用框架进行演示
  • 将数据融入演示中
  • 新数据分析师的演示技能
  • 杂乱无章的数据演示案例
  • 良好的数据演示案例
  • 行之有效的演示技巧
  • 像专业人员一样演示
  • 预测问题
  • 处理异议
  • 最佳问答技巧
  • 成为数据翻译专家
  • 课程小结

使用 R 编程进行数据分析

编程和数据分析

  • 精彩编程世界入门
  • R 语言的乐趣
  • R 语言入门
  • 编程语言
  • R 语言简介
  • RStudio 入门

使用 RStudio 编程

  • 使用 RStudio 编程
  • 编程基础
  • 运算符和计算
  • 源源不断的礼物
  • 欢迎来到 tidyverse
  • 有关 tidyverse 的更多信息
  • 使用管道
  • 编程技巧

用 R 处理数据

  • R 中的数据
  • R 数据框架
  • 使用数据框架
  • 清洗基础工作
  • 整理你的数据
  • 转换数据
  • 相同数据不同结果
  • 偏差函数

更多关于可视化、美学和注释的内容

  • R 中的可视化
  • R 和 tidyverse 中的可视化基础
  • 开始使用 ggplot
  • 通往人力资源分析的职业道路
  • 在 R 中增强可视化
  • 使用 ggplot 做更多事情
  • 美学与切面
  • 注释层
  • 保存你的可视化

文档和报告

  • 文档和报告
  • R Markdown 概述
  • 在 RStudio 中使用 R Markdown
  • Markdown 文档结构
  • 编程增强能力
  • 更多文档元素
  • 代码块
  • 导出文档

结业项目

结业项目介绍

  • 结业项目介绍
  • 雇主寻找什么样的数据分析师
  • 同类最佳

创建你的作品集

  • 开始案例研究
  • 分析案例研究的无限潜力
  • 分享你的作品集

使用你的作品集

  • 讨论你的作品集
  • 情景视频:介绍
  • 情景视频:案例研究
  • 情景视频:解决问题
  • 情景视频:谈判条款
  • 向兽医提供建议

Google 高级数据分析

数据科学基础

数据科学概念入门

  • 欢迎来到课程一
  • 课程一介绍
  • 欢迎来到模块一
  • 探索你的数据工具箱
  • 总结
  • 带着好奇心探索你的数据职业生涯
  • 准备第一次评估

当今数据的影响

  • 欢迎来到模块二
  • 创建数据驱动的商业解决方案
  • 数据驱动型职业推动现代企业发展
  • 非营利组织利用数据分析
  • 数据职业所需的顶级技能
  • 数据专业人员的重要伦理考虑因素
  • 数据专业人员的职业空间
  • 总结

作为数据专业人员的职业生涯

  • 欢迎来到模块三
  • 终生热爱数据
  • 数据职业的未来
  • 给求职者的建议
  • 打造专业的在线形象
  • 加强专业关系
  • 为求职做好准备
  • 突出技术和人员技能
  • 总结

数据应用和工作流程

  • 欢迎来到模块四
  • 沟通在数据科学职业中的重要性
  • PACE 介绍
  • 沟通的关键要素
  • 沟通驱动 PACE
  • 将 PACE 与即将到来的课程主题联系起来
  • 总结

课程一结业项目

  • 作品集的价值
  • 课程一结业项目集介绍
  • 结业项目总结和职业成功秘诀
  • 总结

Python 入门

你好 Python

  • 课程二介绍
  • 欢迎来到模块一
  • 我的数据职业之路
  • Python 入门
  • 了解有关 Python 的更多信息
  • Jupyter Notebooks
  • 面向对象编程
  • Python 如何助力我的数据科学生涯
  • 变量和数据类型
  • 创建精确的变量名
  • 数据类型和转换
  • 总结

函数和条件语句

  • 欢迎来到模块二
  • 应对学习代码时遇到的挑战的技巧
  • 定义函数和返回值
  • 编写简洁的代码
  • 使用注释构建您的代码
  • 使用运算符进行比较
  • 使用 if、elif、else 语句进行决策
  • 总结

循环和字符串

  • 欢迎来到模块三
  • 用分析思维解决问题
  • while 循环简介
  • for 循环简介
  • 带有多个范围参数的循环
  • 使用字符串
  • 字符串切片
  • 格式化字符串
  • 总结

Python 中的数据结构

  • 欢迎来到模块四
  • 列表简介
  • 修改列表内容
  • 元组简介
  • 更多有关循环、列表和元组的内容
  • 字典简介
  • 字典方法
  • 集合简介
  • 包的力量
  • NumPy 简介
  • 基本数组操作
  • Pandas 简介
  • Pandas 基础
  • 布尔屏蔽
  • 分组和聚合
  • 合并和连接数据
  • 总结

课程二结业项目

  • 欢迎来到模块五
  • 课程二结业项目集介绍
  • 结业项目总结和职业成功秘诀
  • 总结

超越数字:将数据转化为洞察

使用数据查找和分享故事

  • 欢迎来到课程三
  • 障碍与成就
  • 欢迎来到模块一
  • 使用六种探索性数据分析实践寻找故事
  • 数据科学和讲故事
  • 将 PACE 和 EDA 实践相结合
  • 数据可视化的 PACE
  • 总结

探索原始数据

  • 欢迎来到模块二
  • 理解数据以驱动价值
  • 数据来源
  • 使用 Python 的基本数据函数进行电子数据处理
  • 发现数据集中的缺失之处
  • 使用 Python 进行日期字符串操作
  • 使用结构化方法在数据集中建立顺序
  • 使用 Python 构建 EDA 结构
  • 总结

清洗你的数据

  • 欢迎来到模块三
  • 处理缺失数据的方法
  • 在 Python 笔记本中处理缺失数据
  • 数据专家的一天
  • 考虑异常值
  • 用 Python 识别和处理异常值
  • 数字与名称排序
  • Python 中的标签编码
  • 输入验证的价值
  • 使用 Python 验证输入
  • 总结

数据可视化与演示

  • 欢迎来到模块四
  • 可视化生命周期
  • 使用 Tableau1
  • 使用 Tableau2
  • 探索数据的可能性
  • 使用 Tableau 制作引人入胜的故事
  • 使用 Tableau 进行专业演示
  • 总结

课程三结业项目

  • 欢迎来到模块五
  • 课程三结业项目集介绍
  • 结业项目总结和职业成功秘诀
  • 总结

统计的力量

统计入门

  • 欢迎来到课程四
  • 参与和联系
  • 欢迎来到模块一
  • 统计在数据科学中的作用
  • 实际中的统计A/B 测试
  • 描述统计与推断统计
  • 中心倾向测量法
  • 离散度测量法
  • 位置测量法
  • 统计是数据驱动型解决方案的基础
  • 用 Python 计算描述统计数据
  • 总结

可能性

  • 欢迎来到模块二
  • 客观概率与主观概率
  • 概率原理
  • 概率和事件的基本规则
  • 条件概率
  • 探索贝叶斯定理
  • 贝叶斯定理的扩展版
  • 概率分布简介
  • 二项分布
  • 泊松分布
  • 正态分布
  • 使用 z 分数对数据进行标准化
  • 用 Python 处理概率分布
  • 总结

抽样

  • 欢迎来到模块三
  • 重视每个人的贡献
  • 抽样简介
  • 抽样流程
  • 比较抽样方法
  • 抽样偏差的影响
  • 抽样如何影响你的数据
  • 中心极限定理
  • 比例的抽样分布
  • 用 Python 对分布进行抽样
  • 总结

置信区间

  • 欢迎来到模块四
  • 置信区间简介
  • 解释置信区间
  • 构建比例的置信区间
  • 构建均值的置信区间
  • 使用 Python 的置信区间
  • 总结

假设检验简介

  • 欢迎来到模块五
  • 在瞬息万变的数据领域不断学习
  • 假设检验简介
  • 均值单样本检验
  • 双样本测试:均值
  • 双样本测试:比例
  • 使用 Python 进行假设检验
  • 总结

课程四结业项目

  • 欢迎来到模块六
  • 向潜在雇主展示你的才能
  • 课程四结业项目集介绍
  • 总结

回归分析:简化复杂的数据关系

复杂数据关系简介

  • 欢迎来到课程五
  • 利用回归模型获得可执行的洞察力
  • 欢迎来到模块一
  • 回归分析中的 PACE
  • 线性回归简介
  • 数学线性回归
  • 逻辑回归简介
  • 总结

简单线性回归

  • 欢迎来到模块二
  • 导师的惊人价值
  • 普通最小二乘估计
  • 进行线性回归假设
  • 用 Python 探索线性回归
  • 评估回归分析中的不确定性
  • 模型评估指标
  • 解释并展示线性回归结果
  • 总结

多元线性回归

  • 欢迎来到模块三
  • 多元回归简介
  • 表示分类变量
  • 利用多重线性回归进行假设
  • 解释多元回归系数
  • 用 Python 解释多元回归结果
  • 过拟合问题
  • 顶级变量选择方法
  • 正则化Lasso、Ridge 和弹性网回归
  • 总结

高级假设检验

  • 欢迎来到模块四
  • 卡方假设检验
  • 方差分析简介
  • 用 Python 探索单因子与双因子方差分析测试
  • 用 Python 进行协方差事后分析
  • 在你职业生涯的每个阶段进行探索
  • 协方差分析
  • 更多因变量:多元方差分析和多变量协方差分析
  • 总结

逻辑回归

  • 欢迎来到模块五
  • 为你的数据找到最佳逻辑回归模型
  • 用 Python 构建逻辑回归模型
  • 评估二项式逻辑回归模型
  • 评估逻辑回归结果的关键指标
  • 解释逻辑回归的结果
  • 用回归模型回答问题
  • 总结

课程五结业项目

  • 欢迎来到模块六
  • 共享模型和建模技术的策略
  • 课程五结业项目集介绍
  • 结业项目总结和职业成功秘诀
  • 总结

机器学习的基础知识

不同类型的机器学习

  • 欢迎来到课程六
  • 用数据取悦他人
  • 欢迎来到模块一
  • 机器学习的主要类型
  • 确定特征何时为无限
  • 分类特征和分类模型
  • 利用推荐系统引导用户兴趣
  • 机器学习中的公平与公正
  • 建立道德模型
  • 用于机器学习的 Python
  • 不同类型的 Python IDE
  • 关于 Python 软件包的更多信息
  • 回答编程问题的资源
  • 你的机器学习团队
  • 与数据专业社区建立联系
  • 总结

构建复杂模型的工作流程

  • 欢迎来到模块二
  • 机器学习中的 PACE
  • 规划一个机器学习项目
  • 克服挑战并从错误中学习
  • 为机器学习模型分析数据
  • 特征工程简介
  • 解决数据集不平衡带来的问题
  • 特征工程和类平衡
  • 朴素贝叶斯简介
  • 用 Python 构建朴素贝叶斯模型
  • 分类模型的主要评估指标
  • 总结

无监督学习技术

  • 欢迎来到模块三
  • K 均值简介
  • 使用 Python 对颜色进行 K 均值压缩
  • 表示 K 均值聚类的关键指标
  • 惯性和轮廓系数指标
  • 用 Python 应用惯性和轮廓分数
  • 总结

基于树的模型

  • 欢迎来到模块四
  • 基于树的模型
  • 用 Python 构建决策树
  • 调整决策树
  • 使用验证功能验证性能
  • 使用 Python 调整和验证决策树
  • 引导聚合
  • 探索随机森林
  • 调整随机森林
  • 用 Python 构建并交叉验证随机森林模型
  • 使用验证数据集构建并验证随机森林模型
  • 自适应增强简介
  • 梯度提升机
  • 调整梯度提升机模型
  • 使用 Python 构建极端梯度提升模型
  • 总结

课程六结业项目

  • 欢迎来到模块五
  • 用你独特的解决方案给面试官留下深刻印象
  • 课程六结业项目集介绍
  • 结业项目总结和职业成功秘诀
  • 总结

结业项目

结业项目介绍

  • 欢迎来到课程七
  • 期望在结业项目中获得什么
  • 结业项目总结和职业成功秘诀

以数据为中心的职业资源

  • 数据专业人员招聘流程
  • 将项目工作纳入你的数据分析集
  • 完善简历
  • 制作一份引人注目的简历
  • 准备面试
  • 数据职业生涯可以从任何地方开始
  • 为什么在线展示很重要
  • 提升在线形象的技巧
  • 制作一份引人注目的简历
  • 让你的简历独一无二

让你的高级数据分析证书发挥作用

  • 恭喜您完成 Google 高级数据分析证书
  • 探索职业机会

IBM 数据分析师

数据分析入门

什么是数据分析

  • 课程介绍
  • 现代数据生态系统
  • 数据生态系统中的主要参与者
  • 定义数据分析
  • 观点:什么是数据分析?
  • 数据分析师的职责
  • 观点:成为数据分析师的素质和技能
  • 数据分析师的一天
  • 观点:数据分析的应用

数据生态系统

  • 数据分析师生态系统概述
  • 数据类型
  • 了解不同类型的文件格式
  • 数据来源
  • 数据专业人员使用的语言
  • 数据存储库概述
  • 关系型数据库管理系统
  • 非关系型数据库
  • 数据集市、数据湖、ETL 和数据管道
  • 大数据基础
  • 大数据处理工具

收集和整理数据

  • 确定分析数据
  • 数据来源
  • 如何收集和导入数据
  • 什么是数据整理?
  • 数据整理工具
  • 数据清理
  • 观点:数据准备和可靠性

数据挖掘和可视化以及结果交流

  • 统计分析概述
  • 什么是数据挖掘?
  • 数据挖掘工具
  • 交流和共享数据分析结果概述
  • 观点:在数据分析中讲故事
  • 数据可视化入门
  • 可视化和仪表板软件简介
  • 观点可视化工具

职业机会和数据分析实践

  • 数据分析领域的就业机会
  • 观点:进入数据行业
  • 观点:雇主对数据分析师有何要求?
  • 数据分析的多种途径
  • 观点:数据专业人员的职业选择
  • 观点:给有抱负的数据分析师的建议
  • 观点:数据专业中的女性

数据分析 Excel 基础

使用电子表格进行数据分析入门

  • 课程介绍
  • 电子表格入门
  • 电子表格基础知识1
  • 电子表格基础知识2
  • 观点:将电子表格用作数据分析工具

开始使用 Excel 速成表

  • 查看、输入和编辑数据
  • 复制、填充和格式化单元格和数据
  • 公式基础
  • 函数入门
  • 在公式中引用数据

使用电子表格清洗和整理数据

  • 数据质量简介
  • 导入文件数据
  • 数据隐私基础知识
  • 观点:数据质量与隐私
  • 删除重复或不准确的数据和空行
  • 处理数据中的不一致之处
  • 清理数据的更多 Excel 功能
  • 观点:数据质量问题

使用电子表格分析数据

  • 使用电子表格分析数据入门
  • 在 Excel 中筛选和排序数据
  • 观点:筛选和排序
  • 数据分析的实用功能
  • 使用 VLOOKUP 和 HLOOKUP 函数
  • 在 Excel 中创建数据透视表简介
  • 观点:透视表
  • 透视表功能

使用 Excel 和 Cognos 实现数据可视化和仪表盘

使用电子表格实现数据可视化

  • 课程介绍
  • 图表简介
  • 访谈:使用可视化技术讲述数据故事
  • 在 Excel 中创建基本图表(折线图、饼图和柱状图)
  • 使用 Excel PivotChart 功能

使用电子表格创建可视化和仪表盘

  • 创建树状图、散点图和直方图
  • 创建填充式地图图表和标示线
  • 仪表板简介
  • 访谈:使用仪表盘展示数据结果
  • 使用 Excel 创建一个简单的仪表盘

使用 Cognos Analytics 创建可视化和仪表盘

  • Cognos Analytics简介和如何注册
  • 在 Cognos Analytics 中导航
  • 在 Cognos Analytics 中创建简单仪表盘
  • Cognos 分析仪表盘的高级功能

用于数据科学、人工智能和开发的 Python

Python 基础知识

  • 类型
  • 表达式和变量
  • 字符串操作

Python 数据结构

  • 列表和元组
  • 字典
  • 设置

Python 编程基础

  • 条件和分支
  • 循环
  • 函数
  • 异常处理
  • 对象和类

用 Python 处理数据

  • 使用 "打开" 读取文件
  • 使用 "打开" 功能编写文件
  • 使用 Pandas 加载数据
  • Pandas 处理和保存数据
  • 一维 Numpy
  • 二维 Numpy

应用程序接口和数据收集

  • 简单的应用程序接口 (1)
  • 简单的应用程序接口 (2)
  • REST API 和 HTTP 请求 (1)
  • REST API 和 HTTP 请求 (2)
  • 用于网络爬虫的 HTML
  • 网络爬虫
  • 处理不同的文件格式csv、xml、json、xlsx

数据科学 Python 项目

Crowdsourcing Short Squeeze Dashboard

  • 用于网络爬虫的 HTML
  • 网络爬虫

使用 Python 的数据科学数据库和 SQL

SQL 入门

  • 课程介绍
  • 数据库简介
  • SELECT 语句
  • 计数、去重、限制
  • INSERT 语句
  • 更新和删除语句

关系数据库和表格简介

  • 关系数据库概念
  • SQL 语句类型DDL 与 DML
  • 创建表语句
  • 更改、删除和清空表
  • 如何在云上创建数据库实例

中级 SQL

  • 使用字符串模式和范围
  • 结果集排序
  • 分组结果集
  • 内置数据库函数
  • 内置日期和时间函数
  • 子查询和嵌套选择
  • 使用多个表格

使用 Python 访问数据库

  • 如何使用 Python 访问数据库
  • 使用 DB-API 编写代码
  • 使用 SQL Magic 访问数据库
  • 用 Python 分析数据
  • 使用 ibm_db API 连接数据库
  • 创建表格、加载数据和查询数据

课程作业

  • 使用真实世界数据集
  • 获取表和列详细信息

数据工程师高级 SQL

  • 视图
  • 存储过程
  • ACID 事务
  • 连接概述
  • 内连接
  • 外连接

使用 Python 进行数据分析

导入数据集

  • 课程介绍
  • 了解数据
  • 数据科学 Python 软件包
  • 用 Python 导入和导出数据
  • 开始用 Python 分析数据
  • 用 Python 访问数据库

数据整理工具

  • 用 Python 预处理数据
  • 在 Python 中处理缺失值
  • Python 中的数据格式化
  • Python 中的数据规范化
  • Python 中的分选
  • 用 Python 将分类变量转化为定量变量

探索性数据分析

  • 探索性数据分析
  • 描述性统计
  • Python 中的 GroupBy
  • 相关性
  • 相关性统计

模型开发

  • 模型开发
  • 线性回归和多重线性回归
  • 利用可视化技术进行模型评估
  • 多项式回归和管道
  • 抽样评估措施
  • 预测与决策

模型评估与完善

  • 模型评估与完善
  • 过拟合、欠拟合和模型选择
  • 岭回归
  • 网格搜索

使用 Python 进行数据可视化

数据可视化工具介绍

  • 欢迎
  • 数据可视化简介
  • Plots 类型
  • Plot 图书馆
  • Matplotlib 简介
  • 使用 Matplotlib 绘制基本图形
  • 加拿大移民数据集
  • 线性图

基本和专用可视化工具

  • 面积图
  • 直方图
  • 柱状图
  • 饼图
  • 箱线图
  • 散点图
  • 直接使用 Matplotlib 绘图

高级可视化和地理空间数据

  • 蜂窝图和词云
  • seaborn 和回归图
  • Folium 简介
  • 带标记的地图
  • 全景地图

使用 Plotly 和 Dash 创建仪表盘

  • 仪表板概述
  • Plotly 简介
  • Dash 简介
  • 制作交互式仪表盘
  • 了解实验室环境

结业项目

展示研究成果

  • 课程介绍
  • 成功数据结果报告的要素
  • 介绍研究结果的最佳做法

IBM 数据科学

什么是数据科学

定义数据科学和数据科学家的工作

  • 课程介绍
  • 什么是数据科学?
  • 数据科学基础
  • 通往数据科学的多种途径
  • 给新数据科学家的建议
  • 课程摘要:定义数据科学
  • 数据科学家的一天
  • 数据科学技能与大数据
  • 了解不同类型的文件格式
  • 数据科学主题和算法
  • 课程总结:数据科学家做什么?

数据科学主题

  • 大数据如何推动数字化转型
  • 云计算简介
  • 数据科学云
  • 大数据基础
  • 数据科学与大数据
  • 什么是 Hadoop
  • 大数据处理工具Hadoop、HDFS、Hive 和 Spark
  • 课程摘要:大数据和数据挖掘
  • 人工智能和数据科学
  • 生成式人工智能和数据科学
  • 神经网络和深度学习
  • 机器学习的应用
  • 课程摘要:深度学习和机器学习

数据科学的应用和职业

  • 公司应如何开始数据科学?
  • 老问题,新数据科学解决方案
  • 数据科学的应用
  • 数据科学如何拯救生命
  • 课程摘要:数据科学应用领域
  • 如何成为数据科学家?
  • 数据科学招聘
  • 数据科学职业
  • 数学和统计学对数据科学的重要性
  • 课程摘要:数据科学的职业和招聘

数据科学的数据知识

  • 了解数据
  • 数据来源
  • 观点:处理各种数据源和数据类型
  • 课程总结:了解数据
  • 数据收集和组织
  • 关系型数据库管理系统
  • 非关系型数据库
  • 数据集市、数据湖、ETL 和数据管道
  • 观点:选择数据存储库的考虑因素
  • 数据集成平台
  • 课程摘要:欢迎学习数据素养

数据科学工具

数据科学工具概述

  • 课程介绍
  • 数据科学工具类别
  • 数据科学的开源工具1
  • 数据科学的开源工具2
  • 数据科学商业工具
  • 基于云的数据科学工具

数据科学语言

  • 数据科学语言
  • Python 简介
  • R 语言简介
  • SQL 简介
  • 数据科学的其他语言

软件包、应用程序接口、数据集和模型

  • 数据科学图书馆
  • 应用程序编程接口 (API)
  • 数据集:为数据科学提供动力
  • 共享企业数据:数据资产交换
  • 机器学习模型:从模型中学习进行预测
  • 示范资产交易所

Jupyter 笔记本和 JupyterLab

  • Jupyter 笔记本简介
  • Jupyter 入门
  • Jupyter 内核
  • Jupyter 架构
  • 其他 Anaconda Jupyter 环境
  • 其他基于云的 Jupyter 环境

RStudio 和 GitHub

  • R 和 RStudio 简介
  • RStudio 中的绘图
  • Git/GitHub 概述
  • GitHub 简介
  • GitHub 存储库
  • GitHub入门
  • GitHub使用分支

数据科学方法论

从问题到方法、从需求到采集

  • 课程介绍
  • 数据科学方法概述
  • 业务理解
  • 分析方法
  • 数据要求
  • 数据收集

从了解到准备、从建模到评估

  • 数据理解
  • 数据准备:概念
  • 数据准备:案例研究
  • 建模:概念
  • 建模:案例研究
  • 评估

从部署到反馈和最终评估

  • 部署
  • 反馈意见
  • 讲故事
  • 课程摘要

用于数据科学、人工智能和开发的 Python

Python 基础知识

  • 类型
  • 表达式和变量
  • 字符串操作

Python 数据结构

  • 列表和元组
  • 字典
  • 设置

Python 编程基础

  • 条件和分支
  • 循环
  • 函数
  • 异常处理
  • 对象和类

用 Python 处理数据

  • 使用 "打开" 读取文件
  • 使用 "打开" 功能编写文件
  • 使用 Pandas 加载数据
  • Pandas 处理和保存数据
  • 一维 Numpy
  • 二维 Numpy

应用程序接口和数据收集

  • 简单的应用程序接口 (1)
  • 简单的应用程序接口 (2)
  • REST API 和 HTTP 请求 (1)
  • REST API 和 HTTP 请求 (2)
  • 用于网络爬虫的 HTML
  • 网络爬虫
  • 处理不同的文件格式csv、xml、json、xlsx

数据科学 Python 项目

Crowdsourcing Short Squeeze Dashboard

  • 用于网络爬虫的 HTML
  • 网络爬虫

使用 Python 的数据科学数据库和 SQL

SQL 入门

  • 课程介绍
  • 数据库简介
  • SELECT 语句
  • 计数、去重、限制
  • INSERT 语句
  • 更新和删除语句

关系数据库和表格简介

  • 关系数据库概念
  • SQL 语句类型DDL 与 DML
  • 创建表语句
  • 更改、删除和清空表
  • 如何在云上创建数据库实例

中级 SQL

  • 使用字符串模式和范围
  • 结果集排序
  • 分组结果集
  • 内置数据库函数
  • 内置日期和时间函数
  • 子查询和嵌套选择
  • 使用多个表格

使用 Python 访问数据库

  • 如何使用 Python 访问数据库
  • 使用 DB-API 编写代码
  • 使用 SQL Magic 访问数据库
  • 用 Python 分析数据
  • 使用 ibm_db API 连接数据库
  • 创建表格、加载数据和查询数据

课程作业

  • 使用真实世界数据集
  • 获取表和列详细信息

数据工程师高级 SQL

  • 视图
  • 存储过程
  • ACID 事务
  • 连接概述
  • 内连接
  • 外连接

使用 Python 进行数据分析

导入数据集

  • 课程介绍
  • 了解数据
  • 数据科学 Python 软件包
  • 用 Python 导入和导出数据
  • 开始用 Python 分析数据
  • 用 Python 访问数据库

数据整理工具

  • 用 Python 预处理数据
  • 在 Python 中处理缺失值
  • Python 中的数据格式化
  • Python 中的数据规范化
  • Python 中的分选
  • 用 Python 将分类变量转化为定量变量

探索性数据分析

  • 探索性数据分析
  • 描述性统计
  • Python 中的 GroupBy
  • 相关性
  • 相关性统计

模型开发

  • 模型开发
  • 线性回归和多重线性回归
  • 利用可视化技术进行模型评估
  • 多项式回归和管道
  • 抽样评估措施
  • 预测与决策

模型评估与完善

  • 模型评估与完善
  • 过拟合、欠拟合和模型选择
  • 岭回归
  • 网格搜索

使用 Python 进行数据可视化

数据可视化工具介绍

  • 欢迎
  • 数据可视化简介
  • Plots 类型
  • Plot 图书馆
  • Matplotlib 简介
  • 使用 Matplotlib 绘制基本图形
  • 加拿大移民数据集
  • 线性图

基本和专用可视化工具

  • 面积图
  • 直方图
  • 柱状图
  • 饼图
  • 箱线图
  • 散点图
  • 直接使用 Matplotlib 绘图

高级可视化和地理空间数据

  • 蜂窝图和词云
  • seaborn 和回归图
  • Folium 简介
  • 带标记的地图
  • 全景地图

使用 Plotly 和 Dash 创建仪表盘

  • 仪表板概述
  • Plotly 简介
  • Dash 简介
  • 制作交互式仪表盘
  • 了解实验室环境

使用 Python 进行机器学习

机器学习入门

  • 课程介绍
  • 欢迎
  • 机器学习入门
  • Python 机器学习
  • 监督与非监督

回归

  • 回归简介
  • 简单线性回归
  • 回归模型中的模型评估
  • 回归模型的评估指标
  • 多元线性回归

分类

  • 分类简介
  • K 近邻
  • 分类的评估指标
  • 决策树简介
  • 构建决策树

线性分类

  • 逻辑回归简介
  • 逻辑回归与线性回归
  • 逻辑回归的训练
  • 支持向量机

聚类

  • 聚类简介
  • K 均值简介
  • K 均值的更多内容

结业项目

导言

  • 项目设想和概述
  • 数据收集概述
  • 数据整理概述

探索性数据分析

  • 探索性数据分析概述

交互式可视分析和仪表盘

  • 交互式可视分析和仪表板

预测分析

  • 预测分析概述

展示数据驱动的洞察力

  • 成功数据结果报告的要素
  • 介绍研究结果的最佳做法

机器学习

有监督的机器学习:回归与分类

机器学习入门

  • 课程介绍
  • 机器学习应用
  • 机器学习定义
  • 监督学习1
  • 监督学习2
  • 无监督学习1
  • 无监督学习2
  • Jupyter notebooks
  • 线性回归模型1
  • 线性回归模型2
  • 代价函数公式
  • 理解代价函数
  • 可视化代价函数
  • 可视化举例
  • 梯度下降
  • 梯度下降的实现
  • 理解梯度下降
  • 学习率
  • 用于线性回归的梯度下降法
  • 运行梯度下降

多元线性回归

  • 多维特征
  • 向量化1
  • 向量化2
  • 用于多元线性回归的梯度下降法
  • 特征缩放1
  • 特征缩放2
  • 判断梯度下降是否收敛
  • 如何设置学习率
  • 特征工程
  • 多项式回归

分类

  • 动机
  • 逻辑回归
  • 决策边界
  • 逻辑回归中的代价函数
  • 简化逻辑回归代价函数
  • 实现梯度下降
  • 过拟合问题
  • 解决过拟合
  • 正则化
  • 用于线性回归的正则方法
  • 用于逻辑回归的正则方法
  • Andrew Ng 和 Fei-Fei Li 谈以人为中心的人工智能

高级学习算法

神经网络

  • 欢迎
  • 神经元和大脑
  • 需求预测
  • 示例:图像感知
  • 神经网络层
  • 更复杂的神经网络
  • 神经网络向前传播
  • 如何用代码实现推理
  • Tensorflow 中数据形式
  • 搭建一个神经网络
  • 单个网络层上的前向传播
  • 前向传播的一般实现
  • 强人工智能
  • 神经网络为何如此高效
  • 矩阵乘法
  • 矩阵乘法规则
  • 矩阵乘法代码

神经网络训练

  • Tensorflow 实现
  • 模型训练细节
  • Sigmoid 激活函数的替代方案
  • 如何选择激活函数
  • 为什么模型需要激活函数
  • 多分类问题
  • Softmax
  • 神经网络的 Softmax 输出
  • Softmax 的改进实现
  • 多个输出的分类
  • 高级优化方法
  • 其它的网络层类型
  • 什么是导数
  • 计算图
  • 大型神经网络案例

应用机器学习的建议

  • 决定下一步做什么
  • 模型评估
  • 模型选择和交叉验证测试集的训练方法
  • 通过偏差与方法进行诊断
  • 正则化、偏差、方差
  • 指定一个用于性能评估的基准
  • 学习曲线
  • 决定下一步做什么
  • 方差与偏差
  • 机器学习开发的迭代
  • 误差分析
  • 添加更多数据
  • 迁移学习 - 使用其他任务中的数据
  • 机器学习项目的完整周期
  • 公平、偏见与伦理
  • 倾斜数据集的误差指标
  • 精确率与召回率的权衡

决策树

  • 决策树模型
  • 学习过程
  • 纯度
  • 选择拆分信息增益
  • 整合
  • 独热编码 One-hot
  • 连续有价值的功能
  • 回归树
  • 使用多个决策树
  • 有放回抽样
  • 随机森林
  • XGBoost
  • 何时使用决策树

无监督学习、推荐器、强化学习

无监督学习

  • 欢迎
  • 什么是聚类
  • K-means 直观理解
  • K-means 算法
  • 优化目标
  • 初始化 K-means
  • 选择聚类数量
  • 发现异常事件
  • 高斯正态分布
  • 异常检测算法
  • 开发与评估异常检测系统
  • 异常检测与监督学习对比
  • 选择使用什么特征

推荐系统

  • 提出建议
  • 使用每个特征
  • 协同过滤算法
  • 二进制标签
  • 均值归一化
  • 协同过滤 Tensorflow 实现
  • 寻找相关特征
  • 协同过滤与基于内容过滤对比
  • 基于内容过滤的深度学习方法
  • 从大型目录中推荐
  • 推荐系统中的伦理
  • 基于内容过滤的 Tensorflow 实现
  • 降低特征数量
  • PCA 算法
  • PCA 代码实现

强化学习

  • 什么是强化学习
  • 示例:火星探测器
  • 强化学习的回报
  • 决策:强化学习的策略
  • 审查关键概念
  • 动作价值函数定义
  • 动作价值函数示例
  • 贝尔曼方程
  • random stochastic environment
  • 示例:连续状态空间应用
  • 登月器
  • 学习状态值函数
  • 改进的神经网络架构
  • ϵ贪婪策略
  • 小批量和软更新
  • 强化学习的状态
  • 课程总结和致谢
  • 吴恩达和切尔西芬谈人工智能和机器人技术

深度学习

神经网络和深度学习

深度学习简介

  • 欢迎
  • 什么是神经网络
  • 用神经网络进行监督学习
  • 为什么深度学习会兴起
  • 关于这门课
  • 杰弗里辛顿访谈
  • 课程资源

神经网络基础知识

  • 二分类
  • logistic 回归
  • logistic 回归成本函数
  • 梯度下降法
  • 导数
  • 更多导数的例子
  • 计算图
  • 使用计算图求导
  • logistic 回归中的梯度下降
  • m 个样本的梯度下降
  • 向量化
  • 向量化的更多例子
  • 向量化 logistic 回归
  • 向量化 logistic 回归的梯度输出
  • Python 中的广播
  • 关于 Python_numpy 向量的说明
  • Jupyter_ipython 笔记本的快速指南
  • logistic 成本函数的解释
  • 彼得阿贝尔访谈

浅层神经网络

  • 神经网络概览
  • 神经网络表示
  • 计算神经网络的输出
  • 多个样本的向量化
  • 向量化实现的解释
  • 激活函数
  • 为什么需要非线性激活函数
  • 激活函数的导数
  • 神经网络的梯度下降法
  • 直观理解反向传播
  • 随机初始化
  • 伊恩古德费洛访谈

深度神经网络

  • 深层神经网络
  • 前向和反向传播
  • 深层网络中的前向传播
  • 正确设置矩阵维度
  • 为什么使用深层表示
  • 搭建深层神经网络块
  • 参数 VS 超参数
  • 这和大脑有什么关系

改进深度神经网络:超参数调整、正则化和优化

深度学习的实践方面

  • 训练集 / 开发集 / 测试集
  • 偏差 / 方差
  • 机器学习基础
  • 正则化
  • 为什么正则化能减少过拟合
  • Dropout 正则化
  • 理解 Dropout
  • 其他正则化方法
  • 输入规范化
  • 梯度消失与梯度爆炸
  • 神经网络的权重初始化
  • 梯度的数值近似
  • 梯度检验
  • 关于梯度检验实现的注记
  • 约书亚本吉奥访谈

优化算法

  • 小批量梯度下降法
  • 理解小批量梯度下降法
  • 指数加权平均
  • 理解指数加权平均
  • 指数加权平均的偏差校正
  • 动量梯度下降法
  • RMSprop
  • Adam 优化算法
  • 学习率衰减
  • 局部最优的问题
  • 林元庆访谈

超参数调优、正则化和编程框架

  • 调优过程
  • 使用适当的量级来选取超参数
  • 超参数调优的实践Pandas VS Caviar
  • 正则化网络的激活函数
  • 将 Batch Norm 拟合进神经网络
  • Batch Norm 为什么奏效
  • 测试时的 Batch Norm
  • Softmax 回归
  • 训练一个 Softmax 分类器
  • 深度学习框架
  • TensorFlow

构建机器学习项目

ML 策略

  • 为什么要制定 ML 策略
  • 正交化
  • 单一评估指标
  • 满足要求和优化指标
  • 训练集 / 开发集 / 测试集的分布
  • 开发集和测试集的大小
  • 什么时候该更改开发集 / 测试集和指标
  • 为什么需要人类水平的性能
  • 可避免偏差
  • 理解人类水平的性能
  • 超过人类水平的性能
  • 提高模型性能
  • 安德烈卡尔帕斯访谈
  • 进行误差分析
  • 清除标注错误的数据
  • 快速搭建你的第一个系统并进行迭代
  • 在不同的划分上进行训练并测试
  • 不匹配数据划分的偏差和方差
  • 解决数据不匹配
  • 迁移学习
  • 多任务学习
  • 什么是端到端的深度学习
  • 是否要使用端到端的深度学习
  • 鲁斯兰萨拉胡季诺夫访谈

卷积神经网络

卷积神经网络基础

  • 计算机视觉
  • 边缘检测示例
  • 更多边缘检测内容
  • 填充
  • 卷积步长
  • 三维卷积
  • 单层卷积网络
  • 简单卷积网络示例
  • 池化层
  • 卷积神经网络示例
  • 为什么使用卷积
  • Yann LeCun 访谈

深度卷积模型:案例研究

  • 为什么要进行案例研究
  • 经典网络
  • 残差网络
  • 残差网络为什么有用
  • 网络中的网络以及 1x1 卷积
  • 谷歌 Inception 网络简介
  • Inception 网络
  • 使用开源的实现方案
  • 迁移学习
  • 数据扩充
  • 计算机视觉现状

物体检测

  • 目标定位
  • 特征点检测
  • 物体检测
  • 卷积的滑动窗口实现
  • 边界框预测
  • 交并比
  • 非极大值抑制
  • Anchor Boxes
  • YOLO 算法
  • 候选区域
  • 利用 U-Net 进行语义分割
  • 移调卷积
  • U-Net 架构直观理解
  • U-Net 架构

特殊应用:人脸识别与神经风格转换

  • 什么是人脸识别
  • One-Shot 学习
  • Siamese 网络
  • Triplet 损失
  • 人脸识别与二分类
  • 什么是神经风格转换
  • 什么是深度卷积网络
  • 代价函数
  • 内容代价函数
  • 风格 / 代价 / 功能
  • 一维到三维推广

序列模型

递归神经网络

  • 为什么选择序列模型
  • 数学符号
  • 循环神经网络
  • 通过时间的反向传播
  • 不同类型的循环神经网络
  • 语言模型和序列生成
  • 新序列采样
  • 带有循环神经网络的梯度消失
  • GRU 单元
  • 长短期记忆
  • 双向循环神经网络
  • 深层循环神经网络

自然语言处理与单词嵌入

  • 词汇表征
  • 使用词嵌入
  • 词嵌入的特性
  • 嵌入矩阵
  • 学习词嵌入
  • Word2Vec
  • 负采样
  • GloVe 词向量
  • 情绪分类
  • 词嵌入除偏

序列模型和注意机制

  • 基础模型
  • 选择最可能的句子
  • 定向搜索
  • 改进定向搜索
  • 定向搜索的误差分析
  • Bleu 得分
  • 注意力模型直观理解
  • 注意力模型
  • 语音辨识
  • 触发词检测

Transformer 神经网络

  • Transformer 神经网络直观理解
  • Self Attention
  • Multi-Head Attention
  • Transformer 神经网络
  • 结论和致谢

Linux

韩顺平

  • 课程内容
  • 应用领域
  • 概述
  • Linux 与 Unix
  • VMware 安装
  • CentOS 安装
  • 网络连接的三种方式
  • 虚拟机克隆
  • 虚拟机快照
  • 虚拟机迁移删除
  • VMtools
  • 目录结构介绍
  • 目录结构详解
  • 远程登陆
  • 远程文件传输
  • vim 快速入门
  • vim 快捷键
  • vim 内容梳理
  • 关机重启
  • 登陆注销
  • 用户管理1
  • 用户管理2
  • 用户管理3
  • 用户管理4
  • 运行级别
  • 找回 root 密码
  • 帮助指令
  • 文件目录指令1
  • 文件目录指令2
  • 文件目录指令3
  • 文件目录指令4
  • 文件目录指令5
  • 文件目录指令6
  • 时间日期指令
  • 查找指令1
  • 查找指令2
  • 压缩和解压1
  • 压缩和解压2
  • 实用指令小结
  • Linux 组的介绍
  • 所有者
  • 所在组
  • 修改所在组
  • rwx 权限
  • 权限说明案例
  • 修改权限
  • 修改所有者和所在组
  • 权限管理应用实例1
  • 权限管理应用实例2
  • 权限管理应用实例3
  • 权限管理应用实例4
  • crond 快速入门
  • crond 时间规则
  • crond 应用实例
  • at 任务调度机制
  • at 任务调度实例
  • 任务调度小结
  • 磁盘分区机制
  • 增加磁盘应用实例
  • 磁盘情况查询
  • 磁盘实用指令
  • 磁盘分区挂载小结
  • NAT 网络原理图
  • 网络配置指令
  • 网络配置实例
  • 主机名和 hosts 映射
  • 网络配置小结
  • 进程基本介绍
  • ps 指令详解
  • 父子进程
  • 终止进程
  • pstree 指令
  • 服务管理1
  • 服务管理2
  • 服务管理3
  • 服务管理4
  • 服务管理5
  • 动态监控系统1
  • 动态监控系统2
  • 监控网络状态
  • 进程管理小结
  • rpm 管理1
  • rpm 管理2
  • yum
  • 软件包管理小结
  • 安装配置 JDK 8
  • 安装配置 tomcat8
  • 安装配置 IDEA
  • 安装配置 MySQL
  • 小结
  • shell 编程快速入门
  • shell 变量
  • 设置环境变量
  • 设置参数变量
  • 预定义变量
  • 运算符
  • 条件判断
  • 单分支多分支
  • case 语句
  • for 循环
  • while 循环
  • read 获取输入
  • 系统函数
  • 自定义函数
  • 定时备份数据库1
  • 定时备份数据库2
  • shell 编程笔记梳理
  • Ubuntu 安装
  • Ubuntu 的中文支持
  • Ubuntu 的 root
  • hello python
  • APT 原理机制图
  • APT 更新源和实例
  • Ubuntu 远程登录和集群
  • python 定制篇梳理
  • CentOS 安装和介绍
  • 日志介绍和实例
  • 日志服务原理图
  • 日志服务配置文件
  • 自定义日志服务
  • 日志轮替介绍
  • 自定义日志轮替
  • 日志轮替机制
  • 内存日志
  • 日志管理笔记梳理
  • 定制自己的 Linux1
  • 定制自己的 Linux2
  • 定制自己的 Linux3
  • 阅读 Linux 内核源码好处
  • 阅读 Linux 内核源码技巧
  • 内核源码阅读及 main
  • 内核升级
  • 备份与恢复介绍
  • 数据备份 dump
  • 数据恢复 restore
  • 数据备份恢复梳理
  • webmin 安装和配置
  • webmin 功能演示
  • 宝塔介绍和安装
  • 宝塔应用实例
  • 可视化管理小结
  • 统计访问量和连接数
  • 找回 MySQL 的 root 密码
  • 访问量排名和 tcpdump
  • 系统权限划分1
  • 系统权限划分2
  • 权限思考题
  • CentOS 启动流程详解
  • I/O 读写监控
  • 统计文件个数和行数
  • 无人值守备份目录
  • Linux 系统优化策略
  • 卖油翁和老黄牛

MySQL

黑马程序员

  • 基础篇介绍
  • 课程内容和数据库相关概念
  • MySQL 安装及启动
  • 数据模型
  • DDL - 通用语法及分类
  • DDL - 数据库操作
  • DDL - 表操作 - 创建和查询
  • DDL - 数据类型及案例
  • DDL - 表操作 - 删除和修改
  • DDL 小结
  • 图形化界面 DataGrip
  • DML - 插入
  • DML - 更新和删除
  • DML 小结
  • DQL - 基础查询
  • DQL - 条件查询
  • DQL - 聚合函数
  • DQL - 分组查询
  • DQL - 排序查询
  • DQL - 分页查询
  • DQL - 案例练习
  • DQL - 执行顺序
  • DQL 小结
  • DCL - 用户管理
  • DCL - 权限控制
  • DCL 小结
  • 函数 - 字符串函数
  • 函数 - 数值函数
  • 函数 - 日期函数
  • 函数 - 流程函数
  • 函数小结
  • 约束 - 概述
  • 约束 - 演示
  • 约束 - 外键约束
  • 约束 - 外键删除更新行为
  • 约束小结
  • 多表查询 - 多表关系介绍
  • 多表查询 - 概述
  • 多表查询 - 内连接
  • 多表查询 - 外连接
  • 多表查询 - 自连接
  • 多表查询 - 联合查询
  • 多表查询 - 子查询介绍
  • 多表查询 - 标量子查询
  • 多表查询 - 列子查询
  • 多表查询 - 行子查询
  • 多表查询 - 表子查询
  • 多表查询 - 练习 1
  • 多表查询 - 练习 2
  • 多表查询小结
  • 事务 - 简介
  • 事务 - 操作演示
  • 事务 - 四大特性 ACID
  • 事务 - 并发事务问题
  • 事务 - 并发事务演示及隔离级别
  • 事务小结
  • 基础篇总结
  • 进阶篇介绍
  • 存储引擎 - MySQL 体系结构
  • 存储引擎 - 简介
  • 存储引擎 - InnoDB 介绍
  • 存储引擎 - MyISAM 和 Memory
  • 存储引擎 - 选择
  • 存储引擎小结
  • MySQL 安装Linux 版本)
  • 索引 - 概述
  • 索引 - 结构 - 介绍
  • 索引 - 结构 - Btree
  • 索引 - 结构 - B+tree
  • 索引 - 结构 - hash
  • 索引 - 结构思考题
  • 索引 - 分类
  • 索引 - 思考题
  • 索引 - 语法
  • 索引 - 性能分析 - 查看执行频次
  • 索引 - 性能分析 - 慢查询日志
  • 索引 - 性能分析 - show profiles
  • 索引 - 性能分析 - explain
  • 索引 - 使用规则 - 验证索引效率
  • 索引 - 使用规则 - 最左前缀法则
  • 索引 - 使用规则 - 索引失效情况1
  • 索引 - 使用规则 - 索引失效情况2
  • 索引 - 使用规则 - SQL 提示
  • 索引 - 使用规则 - 覆盖索引和回表查询
  • 索引 - 使用规则 - 前缀索引
  • 索引 - 使用规则 - 单列索引和联合索引
  • 索引 - 设计原则
  • 索引小结
  • SQL 优化 - 插入数据
  • SQL 优化 - 主键优化
  • SQL 优化 - order by 优化
  • SQL 优化 - group by 优化
  • SQL 优化 - limit 优化
  • SQL 优化 - count 优化
  • SQL 优化 - update 优化
  • SQL 优化小结
  • 视图 - 介绍及基本语法
  • 视图 - 检查选项cascaded
  • 视图 - 检查选项local
  • 视图 - 更新及作用
  • 视图 - 案例
  • 存储过程 - 介绍
  • 存储过程 - 基本语法
  • 存储过程 - 变量 - 系统变量
  • 存储过程 - 变量 - 用户定义变量
  • 存储过程 - 变量 - 局部变量
  • 存储过程 - if 判断
  • 存储过程 - 参数IN, OUT, INOUT
  • 存储过程 - case
  • 存储过程 - 循环 - while
  • 存储过程 - 循环 - repeat
  • 存储过程 - 循环 - loop
  • 存储过程 - 游标 - cursor
  • 存储过程 - 条件处理程序 - handler
  • 存储函数
  • 触发器 - 介绍
  • 触发器 - 案例 1insert 类型)
  • 触发器 - 案例 2update 类型)
  • 触发器 - 案例 3delete 类型)
  • 视图&存储过程&触发器小结
  • 锁 - 介绍
  • 锁 - 全局锁 - 介绍
  • 锁 - 全局锁 - 一致性数据备份
  • 锁 - 表级锁 - 表锁
  • 锁 - 表级锁 - 元数据锁
  • 锁 - 表级锁 - 意向锁
  • 锁 - 表级锁 - 意向锁测试
  • 锁 - 行级锁 - 介绍
  • 锁 - 行级锁 - 行锁
  • 锁 - 行级锁 - 间隙锁&临键锁1
  • 锁 - 行级锁 - 间隙锁&临键锁2
  • 锁小结
  • InnoDB 引擎 - 逻辑存储结构
  • InnoDB 引擎 - 架构 - 内存结构1
  • InnoDB 引擎 - 架构 - 内存结构2
  • InnoDB 引擎 - 架构 - 磁盘结构
  • InnoDB 引擎 - 架构 - 后台线程
  • InnoDB 引擎 - 事务原理 - 概述
  • InnoDB 引擎 - 事务原理 - redolog
  • InnoDB 引擎 - 事务原理 - undolog
  • InnoDB 引擎 - MVCC - 基本概念
  • InnoDB 引擎 - MVCC - 隐藏字段
  • InnoDB 引擎 - MVCC - undolog 版本链
  • InnoDB 引擎 - MVCC - readview 介绍
  • InnoDB 引擎 - MVCC - 原理分析RC 级别)
  • InnoDB 引擎 - MVCC - 原理分析RR 级别)
  • InnoDB 引擎小结
  • MySQL 管理 - 系统数据库介绍
  • MySQL 管理 - 常用工具1
  • MySQL 管理 - 常用工具2
  • MySQL 管理小结
  • 进阶篇总结
  • 运维篇介绍
  • 日志 - 错误日志
  • 日志 - 二进制日志
  • 日志 - 查询日志
  • 日志 - 慢查询日志
  • 主从复制 - 概述
  • 主从复制 - 原理
  • 主从复制 - 主库配置
  • 主从复制 - 从库配置
  • 主从复制 - 测试
  • 分库分表 - 介绍
  • 分库分表 - 介绍 - 拆分方式
  • 分库分表 - MyCat 概述 - 安装
  • 分库分表 - MyCat 概述 - 核心概念
  • 分库分表 - MyCat 入门
  • 分库分表 - MyCat 入门 - 测试
  • 分库分表 - MyCat 配置1
  • 分库分表 - MyCat 配置2
  • 分库分表 - MyCat 分片 - 垂直分库
  • 分库分表 - MyCat 分片 - 垂直分库测试
  • 分库分表 - MyCat 分片 - 水平分表
  • 分库分表 - 分片规则 - 范围分片
  • 分库分表 - 分片规则 - 取模分片
  • 分库分表 - 分片规则 - 一致性 hash 算法
  • 分库分表 - 分片规则 - 枚举分片
  • 分库分表 - 分片规则 - 应用指定算法
  • 分库分表 - 分片规则 - 固定 hash 算法
  • 分库分表 - 分片规则 - 字符串 hash 解析
  • 分库分表 - 分片规则 - 按天分片
  • 分库分表 - 分片规则 - 按自然月分片
  • 分库分表 - MyCat 管理与监控原理
  • 分库分表 - MyCat 管理工具
  • 分库分表 - MyCat 监控1
  • 分库分表 - MyCat 监控2
  • 分库分表总结
  • 读写分离 - 介绍
  • 读写分离 - 一主一从准备
  • 读写分离 - 一主一从读写分离
  • 读写分离 - 双主双从介绍
  • 读写分离 - 双主双从搭建
  • 读写分离 - 双主双从读写分离
  • 读写分离总结
  • 运维篇总结