有关 Chatbot 基本原理、开源框架和 Rasa
阅读了几篇关于 Chatbot 的综述、文档,Rasa 的介绍。另外,调研了一些大厂的 Chatbot 框架,包括Google 的 Dialogflow, Microsoft Bot, AWS LEX, 阿里小蜜;和开源超过 1k stars 的框架,包括 Rasa, OpenNLU, ParlAI, ChatterBot, ai-chatbot-framework。
阅读了几篇关于 Chatbot 的综述、文档,Rasa 的介绍。另外,调研了一些大厂的 Chatbot 框架,包括Google 的 Dialogflow, Microsoft Bot, AWS LEX, 阿里小蜜;和开源超过 1k stars 的框架,包括 Rasa, OpenNLU, ParlAI, ChatterBot, ai-chatbot-framework。
去年把全景拼接算法部署到了郑州机场,实现 4×4K 视频采集、拼接、发布,在单个 1080ti 上可以达到 300FPS。
因为机场光照特别强烈,使用的廉价摄像头曝光不均匀。表现为每张图片都是中间曝光强,四周曝光弱,拼接以后在接缝处会出现条纹(下图)。因为摄像头上半部分是天空,我们假设天空的亮度、颜色是统一的,可以设计一个很简单的算法解决亮度不均匀的问题。
机脚(发动机支架)负责在车架上固定和稳定发动机。为了减少发动机产生的振动,包含一个弹性的缓冲胶(机脚胶),给驾驶员创造一个更平稳,更愉快的旅程。另外,底座在发动机和车身之间起到弹簧的作用,减少了发动机的磨损。此外,发动机的噪音也会降低。随着发动机支座的磨损,通过车辆感觉到的振动量将开始增加。
原厂机脚和底盘摆臂链接件通常是橡胶材料,某些厂家为赛车提供了聚氨酯材料的缓冲胶。橡胶和聚氨酯由于其优异的可逆弹性变形性能和良好的阻尼和能量吸收特性,在许多汽车应用中得到应用。这两种类型的支架各有优缺点,我们将在下面讨论。
Initialize:
1 | import tensorflow as tf |
Work:
1 | model = tf.saved_model.load(dir) |
1 | model = tf.saved_model.load(dir) |
Failed:
1 | model = tf.saved_model.load(dir).signatures['serving_default'] |
1 | tensorflow.python.framework.errors_impl.FailedPreconditionError: Error while reading resource variable conv5_block17_0_bn/gamma_96932 from Container: localhost. This could mean that the variable was uninitialized. Not found: Resource localhost/conv5_block17_0_bn/gamma_96932/N10tensorflow3VarE does not exist. |
User | interview | agreeableness | conscientiousness | extraversion | neuroticism | openness |
---|---|---|---|---|---|---|
heysky | 0.920916 | 0.913731 | 0.919769 | 0.921289 | 0.914613 | 0.917014 |
hershd23 | 0.9180 | 0.9111 | 0.9153 | 0.9150 | 0.9100 | 0.9102 |
baseline | 0.916202 | 0.91123 | 0.915228 | 0.91122 | 0.910378 | 0.911123 |
bekhouche | 0.915746 | 0.910312 | 0.913775 | 0.91551 | 0.908297 | 0.910078 |
*MS1997 | 0.9047 | 0.9075 | 0.9066 | 0.9030 | 0.9018 | 0.9046 |
go2chayan | 0.901859 | 0.903216 | 0.894914 | 0.90266 | 0.901147 | 0.904709 |
azzasama | 0.872129 | 0.891004 | 0.865975 | 0.878842 | 0.863237 | 0.874761 |
Nano 的4G内存太小了(最近还出来一个2G版nano >_<),模型跑不动的患者可以通过以下几个步骤减少内存消耗。
1. 关闭用户图形界面
sudo systemctl set-default multi-user.target
sudo reboot
开启用户图形界面
sudo systemctl set-default graphical.target
sudo reboot
2. 切换图形界面
默认图形界面为Unity,Ubuntu 18 系统自带Gnome3,可切换到 lxde 以节约内存。
3. 关闭 dockerd 节约 49M
Give an image, the task is to generate natural Question based on the image.
keras hdf5 –> .pb
1 | # V2 behaviour is disabled by default in Jetpack 4.4.DP. |
自然交互
:更接近与人之间的交互方式。 PC:键盘鼠标;移动:触控;现在:语音、手势、图像。云端一体
:场景智能
:主动感知、用户理解、个性化推荐、智能决策。5G加速智联网时代的到来,多模态数据成为主流
电阻屏=>电容屏:流量从PC时代走向移动时代
多模态自然交互:移动时代走向智联网时代
1976
发现麦格克效应2015
200 citation–>3000+ citation. 有代表的论文 VQA: Visual Question Answering (ICCV 2015)2016
多个大型多模态数据集发表 (Youtube8m, audioset)2017
VoxCeleb 发布(多模态自然人识别数据集)2018
视觉语音降噪,虚拟人合成技术input image | piece-wise planar segmentation | reconstructed depthmap | texture-mapped 3D model |
Velodyne 通过网线发送的原始数据包为球坐标(spherical coordinates, r, ω, α)。它的 ros driver 提供了两种更方便的格式:/velodyne_points
和/velodyne_scan
其中,/velodyne_points
是转换为XYZ后的坐标,转换的方式如下图;/velodyne_scan
为第8根线的scan值(可直接用来模拟单线雷达)。
目前我成功的有两种方法:
autoware_camera_lidar_calibrator
: 不需要自制标定板,需要手动人工点击9个点velo2cam_calibration
: 全自动,需要定制一个标定板对文本进行OCR前,必须分析和定义文档的逻辑结构。 例如文本块、段落、行的位置;是否有应该重建的表格;是否有“图像”“条形码等”。
文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描图像中的感兴趣区域(RoI, Regions of Interest) 的过程。阅读系统需要从非文本区域分割文本区域,并按正确的阅读顺序排列。将文本正文,插图,数学符号和嵌入文档中的表格等不同区域(或块)的检测和标记称为几何布局分析。但文本区域在文档中扮演不同的逻辑角色(标题,标题,脚注等),这种语义标记是逻辑布局分析的范围。
文档布局分析是几何和逻辑标签的结合。它通常在将文档图像发送到OCR引擎之前执行,但也可用于检测大型存档中同一文档的重复副本,或者通过其结构或图示内容索引文档。
网上的解决方案大多是
删除已经安装的arm64包,然后执行dpkg --remove-architecture arm64
,但是错误在下次刷机后依然会出现
几个月前在计算所用rplidar做过一个送咖啡机器人。可是运用到室外场景Lidar成本太高,于是转战视觉SLAM。
花了几天时间用gazebo仿真,跑通了ORB SLAM2框架。
执行 nvidia-smi
显示: NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
这三个算法是好几年前就好奇但一直没搞懂的神奇算法
2017年应该是最折腾的一年,为了传说中的梦想从深圳到了北京,离开了我超喜欢的一个领导,到计算所后由期待到失望…
时间过的很快,因为把时间都浪费在搬家和融入新团队中了。不过忙忙碌碌的好处就是没有时间发呆和难过了哈哈哈 >_<
不过我喝咖啡从来不是为了提神的 这个世界上唯一提神的东西就是你今天必须完成的事情呀
博士只考一门数据结构与算法分析
,如果这都考不过那就真的重在参与了。本文把看完书以后手撸的代码贴出来,留个纪念。
Tensorflow 的使用者虽多,但真的很难用。幸亏有基于TF和Theano的高层框架Keras
(不幸的是Theano已经停止更新了)。我们通过MNIST来熟悉一下Keras。
先推荐一个学习线性代数的教程http://www.bilibili.com/video/av6731067/,不管你多忙也请看上面这个视频。
3Blue1Brown制作,深入浅出、直观明了地分享数学之美。
调了一下午参数调到怀疑人生,最后发现是参数配置文件没有同步 - -
晚上遗留的一大堆Bug,第二天都自动消失了
肯定是有会写代码的海螺姑娘偷偷入侵了我的电脑 >_<
去年10月份左右从咸鱼买了一把号称93年产原装无修改的Fender vintage 57 stratocaster,拆开看了一下,琴颈的生产日期是1993.05.21,还挺有纪念意义的。但就在我买了新拾音器准备改装它的时候,好像发现了一个天大的秘密。
来北京一个月,一直蜗居在一个小屋里,没有钱花+前途迷茫的感觉真是浑身难受。
我现在的任务是接手之前几个客座生的项目,用Turtlebot做一个送咖啡机器人。第一周的时间用来搭建一个完整的demo