CV:定制设计技最强学习路线之CV简介(定制设计传统视觉技术/相关概念)、早期/中期/定制设计近期应用领域(定制设计偏具体应用)、经典CNN架构(定制设计偏具体算法)概述、常用工具/库/框架/产品、环境安装、定制设计常用数据集、编程技巧
导读:定制设计定制设计定制设计计算机视觉技最强学习路线,定制设计博主花了三个晚上精心整理,定制设计终于结束了,定制设计真心不容易……定制设计希望能够对家学习计算定制设计机视觉技术有所帮助。
目录
计算机视觉技最强学习路线
1、CV定制设计市场岗位要求
Interview之CV:定制设计人工智能领域求职岗位—定制设计计算机视觉的职位简介、薪资介绍、定制设计知识结构之详细攻略
Interview之ML:定制设计机器学习算法工程师结定制设计构知识思维导图集合、定制设计求职九大必备技能之【数学基础、定制设计特征工程能力、定制设计模型评估和优化、定制设计机器学习基本概念/经典算法、定制设计深度学习算法、定制设计业务与应用】(持续更新)
Interview之AI:定制设计人工智能领域岗位求职面试—定制设计人工智能算法工程师知定制设计识及课程大纲(AI定制设计基础之数学基础/定制设计数据结构与算法/定制设计编程学习基础、ML算法简介、DL算法简介)定制设计来理解技术交互流程
Interview之AI:定制设计深度学习算法工程师面定制设计试之常见专业知识考点(定制设计参数初始化策略(Lecun、Xavier/Glorot、Kaiming、基于BN定制设计的随机的参数初始化)、定制设计图像算法基础(ROI)
2、CV定制设计综合应用领域(定制设计自动驾驶等)
AI:定制设计定制设计定制设计人工智能领域之国内外定制设计人工智能产业应用图谱应用层/定制设计基础层详解—AI定制设计八大应用领域之医疗/家居/驾驶/零售/城市/教育/金融/交通、(AI三大基础(算法【计算机视觉/定制设计自然语言处理/机器学习、科研院所/开源社区】、数据【IOT/互联网/手机/传感器/音视频】、计算【计算芯片/定制设计服务器及存储器/AI软件框架/云服务】)
(1)、安防领域—疑犯追踪、定制设计视频结构化
(2)、定制设计金融及互联网领域—刷脸认证
(3)、定制设计手机及娱乐领域—影像分类/影像处理/AR特效
(4)、零售领域—商品识别
(5)、定制设计广告营销领域—定制设计自动化挖掘影像内容广告位
(6)、工业领域—产品质检/3D分拣
(7)、医疗领域—定制设计医疗影像分析
(8)、定制设计自动驾驶领域—环境感知/高精地图/定位
CV:无人驾驶/定制设计自动驾驶汽车中涉及的定制设计软硬件技术(摄像头、雷达、激光雷达)、定制设计计算机视觉技术(检测、分类、跟踪、语义分割)的简介
High&NewTech:定制设计基于人工智能的自动驾定制设计驶技术的前世今生之Why、What、How定制设计最强分析与总结(定制设计包括自动驾驶L5定制设计个分级详细标准,定制设计非常建议收藏)
(9)、无人机/定制设计机器人领域—环境感知/定位/自动避障
3、定制设计基本必备技能(5+1大基础)——AI定制设计人才的基本属性
(1)、定制设计领域概念术语基础
因为AI发展较快,定制设计大多数都不是学生时代定制设计就能学到的,定制设计即课本上没有的,比如
优化相关:分箱、正则化,BP、激活函数,卷积、池化等;
算法名称:LoR/SVM、-LeNet/Alexnet、RNN-LSTM/GRU、Attention-TransformerGPT/BERT等;
AI:人工智能领域之AI定制设计基础概念术语之《Google定制设计发布机器学习术语表 (中英对照)》——持续更新ML、DL相关概念2018年4月!
AI:人工智能领域之AI定制设计基础概念术语之机器学习、深度学习、定制设计数据挖掘中常见关键词、参数等5000定制设计多个单词中英文对照(绝对干货)
AI:定制设计人工智能领域主要方向(定制设计技术和应用)、定制设计与机器学习/定制设计深度学习的关系、定制设计数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/定制设计神经计算学/定制设计数据库的关系(定制设计几张图理清之间的暧昧关系)
(2)、定制设计学术知识基础——懂理论
数学基础【会推导】包括:
高等数学:凸函数/最优化、求导/偏导数;
线性代数:矩阵/向量运算;
概率统计:贝叶斯等;
英语基础【看论文】包括:定制设计至少也要个英语六级,定制设计目的是要紧跟时代,多去看AI技术前沿paper;
定制设计一般大学期间,定制设计多少都会学过,定制设计如果有基础,定制设计此处可以略过,定制设计因为在计算机视觉中,定制设计常用的主要与卷积相关
ML与math:定制设计定制设计机器学习与高等数学基础概念、代码实现、定制设计定制设计案例应用之详细攻略——基础篇
ML与math:机器学习与高等数学基础概念、代码实现、案例应用之详细攻略——进阶篇
(3)、定制设计编程语言基础——能实践
C++和python,定制设计至少会一门编程语言,定制设计还要懂和会写机器学习算法代码;
Computer:少儿编程—定制设计每个人都应该学习编程,定制设计它能教你如何思考—编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言)、编程应用、编程意义之详细攻略
Computer:C语言/C++语言的简介、发展历史、应用领域、编程语言环境IDE安装、学习路线之详细攻略
Python:Python语言的简介(语言特点/pyc介绍/Python版本语言兼容问题(python2 VS Python3))、安装、学习路线(数据分析/机器学习/网页爬等编程案例分析)之详细攻略
Matlab:Matlab编程语言的简介、安装、学习路线(几十项代码编程案例分析)之详细攻略
(4)、深度学习框架基础—会优化
AI:Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介、案例应用之详细攻略
(5)、人工智能领域算法背景基础——领域项目经验
AI:全球人工智能领域代表性学者简介及大佬们的关系圈—向大佬们学习(国外内分开,持续更新/建议收藏)
AI:人工智能领域之《A Simple Tool to Start Making Decisions with the Help of AI—借助人工智能开始决策的简单工具》翻译与解读
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路、11类机器学习算法详细分类之详细攻略
(6)、传统的数字图像处理及OpenCV基础——传统专业基础
4、计算机视觉算法工程师基本技能
一、计算机视觉的简介
二、计算机视觉相关概念简介
三、传统的计算机视觉技术之机器视觉/计算机图形学
四、CV早期、中期、近期具体应用领域(偏具体应用)及其应用案例
五、经典CNN算法(偏具体算法)简介及其应用案例
六、CV领域常用工具、库/框架、现有产品
七、CV计算机视觉环境安装
八、CV领域常用
九、CV编程代码技巧
☆☆一、计算机视觉的简介
CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊、主要研究方向)、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略
☆☆二、计算机视觉相关概念简介
1、计算机视觉的语义鸿沟概念
计算机看到的图像,是由许多[0,255]之间的数值组成的。如果要让计算机像人类一样去识别和感知,之间会存在语义鸿沟。
(1)、跨越语义鸿沟的几大挑战
视角变化
光照变化
背景凌乱
图像变形
图像遮挡
类内差别:比如同样是猫,但是有的之间也是差别很大。
2、卷积概念
膨胀卷积/扩张卷积
DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍)、详解、案例应用等配图集合之详细攻略
DL之CNN:卷积神经网络算法简介之卷积矩阵、转置卷积(反卷积Transpose)、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略
☆☆三、传统的计算机视觉技术之机器视觉/计算机图形学
计算机图形学(Computer Graphics,简称CG)是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。
1、基础知识
CV:传统视觉知识—机器视觉系统的基础知识(机器视觉三要素+典型的工业机器视觉系统五大组件
CV:计算机视觉技术之图像基础知识(一)—以python的cv2库来了解计算机视觉图像基础(傅里叶变换-频域-时域/各种滤波器-线性-非线性-均值-中值-高斯-双边)
CV:计算机视觉技术之图像基础知识(二)—以python的skimage和numpy库来了解计算机视觉图像基础(图像存储原理-模糊核-锐化核-边缘检测核,进阶卷积神经网络(CNN)的必备基础)
CV:计算机视觉技术之图像基础知识(二)—图像内核的九种卷积核可视化解释(blur/bottom sobel /emboss/identity /sobel /outline/sharpen)
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础—视频操作相关案例及其代码实现(将多张图片存为视频/另存为avi视频/录制摄像头)
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础(边缘检测算子+平滑+轮廓标注+形态学+金字塔+傅里叶变换)—代码实现
CV之HOG:图像特征提取之基于方向梯度直方图HOG算法的简介、代码实现(计算图像相似度)之详细攻略
2、像素检测
CV之cv2:基于python语言利用cv2库对几何形状图像边界进行识别检测并计算周长/面积以及输出颜色/形状类型之详细攻略
CV之FD之HOG:图像检测之基于HOG算法、简介、代码实现(计算图像相似度)之详细攻略
3、图形可视化
待定
4、数据预处理
CV之FE:基于TF框架对图像进行数据预处理—去除异常(被损坏)图像 和单通道图像代码实现
CV:利用python的cv2库实现图像数据增强—随机裁剪、随机旋转、随机hsv变换、随机gamma变换代码实现
5、图像生成
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据随机指定七个字符生成逼真车牌图片数据集(自然场景下+各种噪声效果)可视化
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符生成逼真车牌图片(自然场景+各噪效果+对应txt说明文档)
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
6、其他相关技术(如SLAM)
CV之VSLAM:SLAM/VSLAM的简介、视觉SLAM的五大流程之详细攻略
☆☆四、CV早期、中期、近期具体应用领域(偏具体应用)及其应用案例
A、CV早期应用领域
1、OCR文字识别
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测
DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—预测过程
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别
2、计算图像相似度
CV之Hog+HamMingDistance:基于Hog提取和汉明距离对比实现计算图像相似度案例—for循环将多个成对图片依次对比并输出相似度
ML之Hog_HammingDistance:基于Hog特征提取“RGB”图像的768个值的单向vector利用汉明距离算法实现计算图像相似度案例
ML之Hash_EditDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用编辑距离算法实现计算图像相似度案例
ML之Hash_HamMingDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用汉明距离算法实现计算图像相似度案例
ML之SSIM:基于输入图片RGB的三维向量利用SSIM(结构相似性度量)算法实现计算图像相似度案例
ML之SIFT_FLANN:FLANN算法的简介、使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略
CV之kNN/flann:基于ORB提取+kNN检测器、基于SIFT提取+flann检测器实现计算图像相似度并可视化代码实现
CV之FR:基于百度API接口实现计算图像相似度(以计算两张人脸图片相似度判断否为同一个人为例)代码实现
B、CV中期十大应用领域
1、图像分类(Image Classification)
CV之IC:计算机视觉之图像分类(Image Classification)方向的简介、使用方法、案例应用之详细攻略
(0)、手写数字识别
CV之IC之SpatialTransformer:基于ClutteredMNIST手写数字图片数据集分别利用CNN_Init、ST_CNN算法(CNN+ST)实现多分类预测案例训练过程记录
CV之IC:基于sklearn 框架利用xgboost算法对手写数字图片数据集digits实现图像分类案例代码(多分类,模型训练、评估、调优、保存)
(1)、猫狗分类
CV之IC:基于OpenCV的CascadeClassifier级联分类器利用python语言加载猫脸检测文件haarcascade_frontalcatface.xml实现对猫脸检测并标注文本标签
CV之IC之VGG16:基于Keras框架利用卷积神经网络VGG16算法的迁移技术实现猫狗分类识别(图片数据增强→保存h5模型)案例训练过程记录
CV之IC之AlexNet:基于Keras框架利用卷积神经网络类AlexNet算法实现猫狗分类识别(图片数据增强→保存h5模型→加载模型)案例应用
CV之IC之AlexNet:基于tensorflow框架采用CNN卷积神经网络算法(改进的AlexNet,训练/评估/推理)实现猫狗分类识别案例应用
(2)、人脸识别(Face Recognition)
CV之FR:人脸识别(Face Recognition)方向的简介、常用算法模型、常用函数、案例应用之详细攻略
CV之FR之ME/LF:人脸识别中常用的模型评估指标/损失函数(Triplet Loss、Center Loss)简介、使用方法之详细攻略
CV之FR:基于cv2和dlib库自带frontal_face_detector(人脸征检测器)利用landmarks.dat文件实现人脸检测与人脸标记之《极限男人帮》和《NBA全明星球员》案例应用
CV之FR之dlib:基于dlib库利用dlib.get_frontal_face_detector函数实现人脸检测和人脸标记
CV之FR:基于DIY人脸图像数据集(每人仅需几张人脸图片训练)利用Hog方法提取特征和改进的kNN算法实现人脸识别并标注姓名(标注文本标签)—(准确度高达100%)
CV之FR:基于face和cv2库调用摄像头(或视频)实现人脸识别并标注姓名标签包装为GUI界面产品(先指定要识别已知人脸的文件夹转为numpy_array+输入新图片遍历已有numpy_array)
CV之FR:基于某AI公司的API接口基于人脸识别实现计算人脸相似度(计算两张人脸图片相似度进而判断否为同一个人)—利用人工智能算法判断相似度极高的国内外明星案例应用
CV之FR之MTCNN:基于TF框架利用MTCNN算法检测并对齐人脸图像进(人脸识别/人脸相似度)而得出人脸特征向量从而计算两张人脸图片距离案例应用之详细攻略
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准
CV之FR:基于某AI公司的API接口基于人脸识别实现人脸性别预测/人脸年龄预测/人脸颜值预测—利用人工智能算法对国内外明星/企业家预测案例应用
CV之FR:基于dlib、cv2库利用warpPerspective函数和shape_predictor_68_face_landmarks.dat文件实现AI换脸渐变融合的视频效果
CV之FR之FAN:基于人工智能算法实现AI换脸渐变融合的视频效果(以偶像和明星渐变卡通形象为例)
(3)、人脸表情识别、性别识别
CV之FR:基于cv2库两步法利用haarcascade_frontalface_default.xml文件人脸检测/_smile.xml检测器笑脸实现对NBA球星同时进行人脸检测和笑脸识别
CV之FR:基于cv2(加载人脸识别xml文件及detectMultiScale得到人脸特征)、keras的load_model(加载表情hdf5、性别hdf5)实现表情识别和性别识别
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理实现人脸表情识别/脸部表情识别、性别识别(gradcam可视化)案例应用
CV之FR/Keras之CNN:基于Keras框架和cv2库(调用摄像头)利用卷积神经网络模型(2+1)算法实现实时人脸识别并标注姓名标签
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理(cv2自带两步检测法)实现对《跑男第六季第五期》之如花视频片段(或调用摄像头)进行实时脸部表情识别
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理(cv2自带两步检测法)实现对《跑男第六季第五期》之如花视频片段(或调用摄像头)进行实时性别、脸部表情识别
(4)、AI换脸
CV之Face Change:基于人工智能实现国内众多一线美女明星换脸(基于Face++输出4*106个特征点定位+融合代码、deepfake技术)
AI黑科技:目前最流行的人工智能换脸软件(FakeAPP/Faceswap/Openfaceswap/Deepfacelab)的简介、对比之详细攻略
(5)、人脸口罩识别
CV之FR:基于paddlehub 框架利用mobile_mask人工智能算法实现人脸口罩图像识别(二分类识别,可结合无人机可,实现实时检测实时警告提醒)
2、目标检测(Object Detection)
CV之OD:计算机视觉之目标检测(Object Detection)方向的简介、使用方法、案例应用之详细攻略
CV之OD之SSD:基于tensorflow框架利用SSD算法实现目标检测(21类)案例应用
CV之OD之YOLOv3:基于Tensorflow框架利用YOLOv3算法实现目标检测(以热播新剧《庆余年》为例)案例应用
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《跑男第六季》第四期片视频段进行实时目标检测
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间—东道主俄罗斯5-0完胜沙特》视频段实时检测
CV之OD:基于深度学习算法实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别(准确度非常高)
3、图像分割(Image Segmentation)
CV之IS:计算机视觉之图像分割(Image Segmentation)/语义分割算法的简介、使用方法、案例应用之详细攻略
CV之IS:计算机视觉中图像分割(语义分割)最diao炸(完)天(整)的思维导图
CV之IS:基于pixellib库和coco数据集且加载.h5文件利用Mask RCNN算法实现图像实例分割简单代码全实现(以热播电视剧《庆余年》视频片段为例)案例应用
CV之IS:基于pixellib库和coco数据集且加载.h5文件利用deeplabv3和xception算法实现图像语义分割/图像分割简单代码全实现(以热播电视剧《庆余年》视频片段为例)案例应用
DL之Panoptic Segmentation:Panoptic Segmentation(全景分割)的简介(论文介绍)、全景分割挑战简介、案例应用等配图集合之详细攻略
CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务、算法演化、目标检测和图像分割(语义分割/实例分割/全景分割)的对比
DL之MaskR-CNN:基于类MaskR-CNN算法(RetinaNet+mask head)利用数据集(resnet50_coco_v0.2.0.h5)实现目标检测和目标图像分割(语义分割)
Keras之Mask R-CNN:《极限挑战》第四季第2期助力高考—使用Mask R-CNN代替Photoshop抠图、颜色填充框出目标检测/图像分割/语义分割
4、图像增强(Image Enhancement,图像修复/超分)
(1)、图像修复(Image Inpainting)
(2)、超分辨率(Super Resolution)
CV之SR:超分辨率(Super resolution)的简介、使用方法、案例应用之详细攻略
CV之SR:基于TF框架实现图像超分辨率源代码(提高图像的分辨率,源自pix2pix模型中的部分代码)
(3)、图像上色
DL之pix2pix:基于food_resized数据集利用TF框架的pix2pix模型实现Auto Color黑白图像上色/老照片上色/黑白变彩色技术—训练&测试过程全记录
CV之IE之NoGAN:基于fastai框架利用NoGAN算法实现图像增强技术(图片上色实现对旧图像和电影片段进行着色和修复,以爱因斯坦旧照/鲁迅旧照/清末官员生活场景旧照为例)案例应用
5、图像生成(Image Generation)
CV之IG:图像生成(Image Generation)的简介、使用方法、案例应用之详细攻略
CV之IG之DCGAN:基于keras框架利用深度卷积对抗网络DCGAN算法对MNIST数据集实现图像生成(保存h5模型→加载模型)案例应用
CV之IG:基于TF框架利用ResNet算法网络DIY自定义图像生成网络(定义卷积和反卷积)实现代码
DL之GAN:High&NewTech基于计算机视觉领域GAN技术—最新黑科技之秒变宝宝——回到最初的样子
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成原始的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更大尺寸的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成带背景的不同尺寸高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例
CV之IE之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成不同尺寸和质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)—五个架构设计思维导图
6、图像检索(Image Retrieval)
CV之IR:计算机视觉之图像检索(Image Retrieval)方向的简介、使用方法、案例应用之详细攻略
7、图像描述(Image Captioning) —(多模态领域)
CV之IC: 图像描述(Image Captioning) 的简介、使用方法、案例应用之详细攻略
CV之IC:Image Caption图像描述算法的相关论文、设计思路、关键步骤相关配图之详细攻略
8、图像风格迁移(Image Neural Style 图像风格变换) CycleGAN
CV之NS之ME/LF:图像风格迁移中常用的模型评估指标/损失函数(内容损失、风格损失)简介、使用方法之详细攻略
CV之NS:图像风格迁移(Neural Style 图像风格变换)算法简介、过程思路、关键步骤配图、案例应用之详细攻略
CV之NS之CycleGAN:基于apple2orange数据集利用TF框架的CycleGAN算法实现图像风格迁移/图像转换—训练&测试过程图文教程全记录
CV之NS之VGG16:基于预训练模型VGG16训练COCO的train2014数据集实现训练《神奈川冲浪里》风格配置yml文件
CV之NS之VGG16:基于TF Slim库利用VGG16算法的预训练模型实现七种不同快速图像风格迁移设计(cubist/denoised_starry/mosaic/scream/wave)案例
CV之NS之VGG16:基于Keras框架利用VGG16算法实现图像风格迁移设计(以设计《复仇者联盟3》灭霸图像风格迁移为例)案例应用
9、姿态估计(Image Pose Estimation)
CV之IPE之PoseEstimation:Pose Estimation人体姿态估计的简介(AI识人,OpenPose+DeepCut+RMPE+Mask RCNN)、案例应用(活动识别)之详细攻略
CV之IPE之DNN:基于OpenPose和OpenCV利用DNN算法的.pb文件实现对视频单个体进行实时姿态估计检测(以詹姆斯扣篮+美女跳舞为例)案例应用
CV之IPE之MobiLenet:基于openpose利用CMU/MobilenetV2算法实现对多人体姿态估计检测(以勒布朗詹姆斯扣篮姿态为例)案例应用
CV之IPE之MobilenetV2:基于keras利用Mobilenet V2算法实现局部相似域的多人实时二维姿态估计(以詹姆斯扣篮+美女跳舞为例)案例应用
10、动作识别/行为识别(行为检测和行为分类)
(1)、手势识别
CV之API:利用Face++的人体识别接口,实现摄像头实时手势识别
(2)、行人追踪
C、CV近期新的具体应用领域
1、图像标题生成
CV之ICG:计算机视觉之图像标题生成(Image Caption Generator)算法的简介、使用方法、案例应用之详细攻略
2、图像动画(Image Animation)
Paper/CV之IA:《First Order Motion Model for Image Animation图像动画的一阶运动模型》翻译与解读
CV之IA:利用人工智能算法实现图像动画(以让古代皇帝画像以及古代四大美女画像动起来-来模仿偶像胡歌剧中角色表情动作为例-照片嗨起来)案例应用
3、立体视觉
4、多模态、大模型(大预训练模型)
Paper:《NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion,女娲:用于神经视觉世界创造的视觉》翻译与解读
Paper:《Multimodal Machine Learning: A Survey and Taxonomy,多模态机器学习:综述与分类》翻译与解读
Paper:《Pre-Trained Models: Past, Present and Future大规模预训练模型的发展历史、最新现状和未来发展三个方向》翻译与解读
AI:人工智能的多模态融合模型的简介、发展以及未来趋势
AI:大力出奇迹?Bigger is better?AI下一代浪潮?—人工智能的大语言模型(LLMs)的简介、发展以及未来趋势
5、知识蒸馏、可解释性
AI:模型蒸馏/知识蒸馏(Knowledge Distilling,KD)算法的简介、案例应用之详细攻略
DL之CNN:模型可解释性之卷积神经网络算法的卷积原理可视化——CNN网络的3D可视化(LeNet-5为例可视化)
Paper之RegNet:《Designing Network Design Spaces》的翻译与解读—2020年3月30日来自Facebook AI研究院何恺明团队最新算法RegNe
☆☆五、经典CNN算法(偏具体算法)简介及其应用案例