15158846557 在线咨询 在线咨询
15158846557 在线咨询
所在位置: 首页 > 营销资讯 > 网站运营 > AI 学习笔记(一)

AI 学习笔记(一)

时间:2023-08-14 11:03:01 | 来源:网站运营

时间:2023-08-14 11:03:01 来源:网站运营

AI 学习笔记(一): 2022年12月1日,Open AI发布了ChatGPT。这个AI聊天机器人迅速火爆出圈,半个月用户突破100万,两个月用户突破一个亿,刷新了历史记录。ChatGPT也引发了我对于AI的学习热情,因为就在2022年10月17日,我曾经对一个朋友说,我希望将来造一个有独立人格的虚拟数字人。而ChatGPT所代表的当前业界在AI方面的技术进步,给了我极大的信心和勇气。我希望自己将来能够在大数据+AI领域做出伟大的产品。

此前我接触到的AI,主要是应用层面的。2018年8月开始做杭州城市大脑,其中就包含AI在交通治堵方面的应用,如AI信号灯的控灯算法;还有AI在公安、综治和城管方面的应用,如人脸、体态、车牌的实体识别,违章停车、出店经营、游商的事件识别;其他还有疫情期间利用OCR识别身份证上的信息完成人员进出登记。2022年8月开始做平阳一网统管的项目,其中包含AI在城市治理方面的应用,如无人机水域巡查做水面漂浮物和岸边违章建筑的事件识别;无人车上路执法做乱堆物堆料、违规户外广告、垃圾箱满溢、沿街晾挂的事件识别;农贸市场的监控摄像头做熟食店未穿衣戴帽、占道经营、垃圾洒落、吸烟等事件识别。除此之外,还有阿里云官网的智能客服以及信访局客户的智能客服。

但是ChatGPT给我打开了关于AI应用的新天地。我决定从两个方面去学习AI,一个是ChatGPT的下游应用,包括B端和C端的应用,另一个是ChatGPT的原理以及背后的技术。

(一)ChatGPT的应用

首先是在网上看了不少评论文章,看到ChatGPT能帮人写文章,写剧本,设计文案,编写或重构代码,包括阿里ATA上的试用和评论文章。各种评论基本上都是很正面的,甚至是惊叹,有人还提出了范式转移的问题。

其次是自己上Open AI的网站试用,但是有两个阻碍:1)国内IP不能访问,除非科学上网,不过我选择了在阿里云上开通一台位于美国的Windows服务器,通过这台服务器访问Open AI的网站,问题解决;2)Open AI的网站上注册账号需要有国外的手机,这个可以上http://sms.activate.org去购买一个虚拟号码解决,很便宜的,一块钱不到,不过我选择了在淘宝上购买一个现成的注册账号,问题解决。

试用之后,果然很赞,用中文或英语提问,写文章、写剧本,秒级回应,跟真人比,质量尚可。但是每次试用要先登录位于美国的Windows服务器,太麻烦了。

后来在网上发现一种可以把ChatGPT跟微信账号关联起来的方法,这样就可以直接跟这个微信账号聊天,甚至可以把这个微信账号拉到群里,供多人一起试用。于是我在阿里云上开通一台位于杭州的CentOS服务器,部署了docker,下载一个现成的镜像,运行之后,再用一个实名认证的微信账号扫码登录。我把这个微信版ChatGPT介绍给好几个朋友试用,想看看不同职业的人们会怎样来使用这样的AI聊天机器人。

最近又阅读了《腾讯研究院AIGC发展趋势报告2023》,这篇68页的文章,帮助我建立了关于AIGC的概要全貌。里面引用的很多更深入的研究文章,需要花时间进一步去学习了解。

(二)ChatGPT背后的技术

先学习关于AI的基础知识。阅读人工智能之父图灵发表于1950的论文《Turing-Computing Machinery and Intelligence》,从中了解大名鼎鼎的图灵测试。

在IBM的网站(https://www.ibm.com/topics/artificial-intelligence)有一些文章,介绍什么是人工智能、什么机器学习、什么是神经网络、什么是深度学习。

机器学习包括监督学习和非监督学习。工作流程分三步:1)决策流程(A Decision Process);2)错误函数(An Error Function);3)模型优化流程(A Model Optimization Process)。

监督学习的算法有两类:分类和回归,具体的算法有:1)神经网络(Neural networks):ANN、RNN、CNN;2)朴素贝叶斯(Naive Bayes);3)线性回归(Linear Regression);4)逻辑回归(Logistic Regression);5)支持向量机(Support Vector Machine);6)K最近邻法(KNN:K-nearest Neighbor);7)随机森林(Random Forest)。监督学习的应用领域:图像/对象识别、预测分析、客户情绪分析、垃圾邮件检测。

非监督学习的算法有三类:聚类、关联、降维。具体的算法有:1)聚类算法:K均值聚类(K-means clustering)、层次聚类(Hierarchical clustering);2)降维算法:主成分分析(PCA:Principal Component Analysis)、奇异值分解(SVD:Singular Value Decomposition)。关联的算法没有介绍。非监督学习的应用领域:新闻分区、计算机视觉、医疗影像、异常检测、客户画像、推荐引擎。

有监督学习和无监督学习的根本区别:是否使用标注数据集。其他的不同:目标、应用领域、复杂度、缺点。此外还有半监督学习:同时使用有标注的和没有标注的数据集。以及强化学习(Reinforcement Learning)。

神经网络(Neural networks or Artificial neural networks):1)感知机(Perceptron);2)多层感知机(MLP:Multi-Layers Perceptron);3)卷积神经网络(CNN:Convolutional Neural Networks);4)递归神经网络(RNN:Recurrent Neural Networks)。

深度学习:神经网络的层数>3层。深度学习的应用:1)执法;2)金融服务;3)客户服务;4)医疗保健。

人工智能:1)ANI:Artificial Narrow Intelligence;2)AGI:Artificial General Intelligence;3)ASI:Artificial Super Intelligence。

以上是IBM网站的内容(英文),不过内容的组织不是很好,没有形成层次分明的知识树。

关键词:笔记,学习

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭