S1NH

有关 Chatbot 基本原理、开源框架和 Rasa

发表于 2021-12-17 分类于算法与硬件

阅读了几篇关于 Chatbot 的综述、文档，Rasa 的介绍。另外，调研了一些大厂的 Chatbot 框架，包括Google 的 Dialogflow, Microsoft Bot, AWS LEX, 阿里小蜜；和开源超过 1k stars 的框架，包括 Rasa, OpenNLU, ParlAI, ChatterBot, ai-chatbot-framework。

阅读全文 »

解决廉价摄像头在图像拼接中产生的曝光不均匀问题

发表于 2021-12-15 分类于算法与硬件

去年把全景拼接算法部署到了郑州机场，实现 4×4K 视频采集、拼接、发布，在单个 1080ti 上可以达到 300FPS。

因为机场光照特别强烈，使用的廉价摄像头曝光不均匀。表现为每张图片都是中间曝光强，四周曝光弱，拼接以后在接缝处会出现条纹（下图）。因为摄像头上半部分是天空，我们假设天空的亮度、颜色是统一的，可以设计一个很简单的算法解决亮度不均匀的问题。

阅读全文 »

如何挑选适合的电吉他琴弦规格，及关于drop调弦适用琴弦规格的问题

发表于 2021-11-28 分类于音乐相关

本文大多数内容翻译自 Ernie Ball 的官方博客

在知乎看到这样一个问题，因此搬运了一篇文章：原文链接
在练习曲目的过程中，有一些一些关于降调调弦及琴弦规格的一些问题疑问。

从一开始的标准调弦，到后来的drop C。自己用的琴有效弦长25.5。极限应该是dropC了，但一些喜欢的曲目需要dropB调弦，所以有这些疑问：
1:有效弦长25.5的琴，能否达到dropB的要求？所选用弦的规格如何挑选？
2:影响调弦的因素还有那些，比如跟琴本身有没有关系，打个比方，存不存在schecter的琴可以降到B而dean的琴不行？
3:我现在自己琴用的10-46，会不会对琴颈有影响？

阅读全文 »

关于 MAZDA RX8 转子发动机 —— 您需要了解的所有内容

发表于 2021-05-21 分类于赛车

全文翻译自 https://www.motorverso.com/rx8-engine/

谨以本文，向日本马自达公司的那些工程师们表示敬意，如果没有你们的坚持，这世上会少了一个奇迹。

阅读全文 »

是否需要升级强化底盘胶套（机脚/摆臂/连杆）？

发表于 2021-05-10 分类于其它笔记

机脚（发动机支架）负责在车架上固定和稳定发动机。为了减少发动机产生的振动，包含一个弹性的缓冲胶（机脚胶），给驾驶员创造一个更平稳，更愉快的旅程。另外，底座在发动机和车身之间起到弹簧的作用，减少了发动机的磨损。此外，发动机的噪音也会降低。随着发动机支座的磨损，通过车辆感觉到的振动量将开始增加。

原厂机脚和底盘摆臂链接件通常是橡胶材料，某些厂家为赛车提供了聚氨酯材料的缓冲胶。橡胶和聚氨酯由于其优异的可逆弹性变形性能和良好的阻尼和能量吸收特性，在许多汽车应用中得到应用。这两种类型的支架各有优缺点，我们将在下面讨论。

阅读全文 »

「tensorflow」 Variable was uninitialized

发表于 2020-10-12 分类于算法与硬件

Initialize:

import tensorflow as tf
import numpy as np

dir = './model/tf_savedmodel'
zeros = tf.constant(np.zeros([1, 640, 960, 3]), dtype=float)

Work:

1 2	model = tf.saved_model.load(dir) output = model.signatures['serving_default'](zeros)

1 2	model = tf.saved_model.load(dir) output = model(zeros)

Failed:

1 2	model = tf.saved_model.load(dir).signatures['serving_default'] output = model(zeros)

tensorflow.python.framework.errors_impl.FailedPreconditionError:  Error while reading resource variable conv5_block17_0_bn/gamma_96932 from Container: localhost. This could mean that the variable was uninitialized. Not found: Resource localhost/conv5_block17_0_bn/gamma_96932/N10tensorflow3VarE does not exist.
	 [[{{node StatefulPartitionedCall/fusion_network/conv5_block17_0_bn/ReadVariableOp}}]] [Op:__inference_signature_wrapper_21102]

Function call stack:
signature_wrapper

第一印象（First Impressions）人物性格特征预测

发表于 2020-10-12 分类于算法与硬件

User	interview	agreeableness	conscientiousness	extraversion	neuroticism	openness
heysky	0.920916	0.913731	0.919769	0.921289	0.914613	0.917014
hershd23	0.9180	0.9111	0.9153	0.9150	0.9100	0.9102
baseline	0.916202	0.91123	0.915228	0.91122	0.910378	0.911123
bekhouche	0.915746	0.910312	0.913775	0.91551	0.908297	0.910078
*MS1997	0.9047	0.9075	0.9066	0.9030	0.9018	0.9046
go2chayan	0.901859	0.903216	0.894914	0.90266	0.901147	0.904709
azzasama	0.872129	0.891004	0.865975	0.878842	0.863237	0.874761

阅读全文 »

「Jetson Nano」 Reduce Memory Usage

发表于 2020-10-12 分类于算法与硬件

Nano 的4G内存太小了（最近还出来一个2G版nano >_<），模型跑不动的患者可以通过以下几个步骤减少内存消耗。

1. 关闭用户图形界面
sudo systemctl set-default multi-user.target
sudo reboot

开启用户图形界面
sudo systemctl set-default graphical.target
sudo reboot

2. 切换图形界面
默认图形界面为Unity，Ubuntu 18 系统自带Gnome3，可切换到 lxde 以节约内存。

GNOME3 :1047M
Unity: 517M
xfce: 247M
lxde: 214M

3. 关闭 dockerd 节约 49M

A Survey of Visual Question Generation

发表于 2020-09-21 分类于算法与硬件

Give an image, the task is to generate natural Question based on the image.

Another list of VQA https://github.com/jokieleung/awesome-visual-question-answering
A survey of Image Caption in Chinese https://zhuanlan.zhihu.com/p/27771046
Survey of the State of the Art in Natural Language Generation: Core tasks, applications and evaluation [Link

阅读全文 »

Inference using TensorRT Backend.

发表于 2020-09-21 分类于算法与硬件

0x01 Tensorflow 2.0

1.1. Convert

keras hdf5 –> .pb

# V2 behaviour is disabled by default in Jetpack 4.4.DP.
import tensorflow.compat.v2 as tf
from tensorflow.keras.models import load_model

model = load_model('./model/fer2013_mini_XCEPTION.102-0.66.hdf5')
model.save('./model/tf_savedmodel', save_format='tf')

阅读全文 »

多模态人工智能与边缘计算技术

发表于 2020-09-21 分类于算法与硬件

自然交互：更接近与人之间的交互方式。 PC：键盘鼠标；移动：触控；现在：语音、手势、图像。
云端一体：
场景智能：主动感知、用户理解、个性化推荐、智能决策。

0x01 多模态自然交互

5G加速智联网时代的到来，多模态数据成为主流
电阻屏=>电容屏：流量从PC时代走向移动时代
多模态自然交互：移动时代走向智联网时代

1976 发现麦格克效应
2015 200 citation–>3000+ citation. 有代表的论文 VQA: Visual Question Answering (ICCV 2015)
2016 多个大型多模态数据集发表 (Youtube8m, audioset)
2017 VoxCeleb 发布（多模态自然人识别数据集）
2018 视觉语音降噪，虚拟人合成技术

阅读全文 »

Planar Reconstruction - 深度学习之平面重建

发表于 2019-11-30 分类于算法与硬件


input image	piece-wise planar segmentation	reconstructed depthmap	texture-mapped 3D model

阅读全文 »

0x00 Velodyne 简介

1. 数据结构及坐标系

Velodyne 通过网线发送的原始数据包为球坐标（spherical coordinates, r, ω, α）。它的 ros driver 提供了两种更方便的格式：/velodyne_points和/velodyne_scan

其中，/velodyne_points是转换为XYZ后的坐标，转换的方式如下图；/velodyne_scan为第8根线的scan值（可直接用来模拟单线雷达）。

阅读全文 »

0x01 制作标定板

在线生成棋盘格 https://calib.io/pages/camera-calibration-pattern-generator
在线生成aruco http://chev.me/arucogen/

0x02 相机标定

camera_calibration: 使用棋盘格进行标定；
kalibr: 这个感觉更专业一些，可以同时标多目和IMU。

0x03 雷达–>相机外参标定

目前我成功的有两种方法：

autoware_camera_lidar_calibrator : 不需要自制标定板，需要手动人工点击9个点
velo2cam_calibration : 全自动，需要定制一个标定板

阅读全文 »

2018 年终总结

发表于 2019-01-09 分类于其它笔记

又到写年终总结的时间了

毕业工作了

阅读全文 »

文档布局分析 & 扭曲文档图像恢复 --- Document Layout Analysis & Document Image Dewarping

发表于 2018-09-20 分类于算法与硬件

0x00

对文本进行OCR前，必须分析和定义文档的逻辑结构。例如文本块、段落、行的位置；是否有应该重建的表格；是否有“图像”“条形码等”。

文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描图像中的感兴趣区域（RoI, Regions of Interest) 的过程。阅读系统需要从非文本区域分割文本区域，并按正确的阅读顺序排列。将文本正文，插图，数学符号和嵌入文档中的表格等不同区域（或块）的检测和标记称为几何布局分析。但文本区域在文档中扮演不同的逻辑角色（标题，标题，脚注等），这种语义标记是逻辑布局分析的范围。

文档布局分析是几何和逻辑标签的结合。它通常在将文档图像发送到OCR引擎之前执行，但也可用于检测大型存档中同一文档的重复副本，或者通过其结构或图示内容索引文档。

Document Layout Analysis

阅读全文 »

竟然拍了照片

发表于 2018-08-31 分类于音乐相关

淘宝的搞活动临时拉我跑龙套，拍了几张照片

阅读全文 »

鲸落分手演出

发表于 2018-05-14 分类于音乐相关

阅读全文 »

安装NVIDIA Jetpack/DriveInstall后，apt-get 报错无arm64源

发表于 2018-05-12 分类于算法与硬件

网上的解决方案大多是删除已经安装的arm64包，然后执行dpkg --remove-architecture arm64，但是错误在下次刷机后依然会出现

阅读全文 »

制作一个送咖啡机器人 -- ORB SLAM2

发表于 2018-05-12 分类于算法与硬件

几个月前在计算所用rplidar做过一个送咖啡机器人。可是运用到室外场景Lidar成本太高，于是转战视觉SLAM。
花了几天时间用gazebo仿真，跑通了ORB SLAM2框架。

解决闭环

阅读全文 »

linux kernel bug 导致无法载入 nvidia 驱动

发表于 2018-03-23 分类于算法与硬件

执行 nvidia-smi 显示： NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

阅读全文 »