S1NH

世界在旅程的尽头终结


  • 首页

  • 分类

  • 归档

  • 关于

  • 搜索

2018 年终总结

发表于 2019-01-09 | 更新于 2019-01-17 | 分类于 工作笔记 | 评论数:

又到写年终总结的时间了

毕业工作了

阅读全文 »

文档布局分析 & 扭曲文档图像恢复 --- Document Layout Analysis & Document Image Dewarping

发表于 2018-09-20 | 更新于 2018-12-04 | 分类于 图形图像 | 评论数:

0x00

对文本进行OCR前,必须分析和定义文档的逻辑结构。 例如文本块、段落、行的位置;是否有应该重建的表格;是否有“图像”“条形码等”。

文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描图像中的感兴趣区域(RoI, Regions of Interest) 的过程。阅读系统需要从非文本区域分割文本区域,并按正确的阅读顺序排列。将文本正文,插图,数学符号和嵌入文档中的表格等不同区域(或块)的检测和标记称为几何布局分析。但文本区域在文档中扮演不同的逻辑角色(标题,标题,脚注等),这种语义标记是逻辑布局分析的范围。

文档布局分析是几何和逻辑标签的结合。它通常在将文档图像发送到OCR引擎之前执行,但也可用于检测大型存档中同一文档的重复副本,或者通过其结构或图示内容索引文档。

阅读全文 »

竟然拍了照片

发表于 2018-08-31 | 更新于 2019-01-08 | 分类于 音乐 | 评论数:

淘宝的搞活动临时拉我跑龙套,拍了几张照片

阅读全文 »

鲸落分手演出

发表于 2018-05-14 | 更新于 2019-01-08 | 分类于 音乐 | 评论数:

还有好多视频在网易云音乐里。


阅读全文 »

安装NVIDIA Jetpack/DriveInstall后,apt-get 报错无arm64源

发表于 2018-05-12 | 分类于 工作笔记 | 评论数:

网上的解决方案大多是删除已经安装的arm64包,然后执行dpkg --remove-architecture arm64,但是错误在下次刷机后依然会出现

阅读全文 »

制作一个送咖啡机器人 -- ORB SLAM2

发表于 2018-05-12 | 分类于 SLAM | 评论数:

几个月前在计算所用rplidar做过一个送咖啡机器人。可是运用到室外场景Lidar成本太高,于是转战视觉SLAM。
花了几天时间用gazebo仿真,跑通了ORB SLAM2框架。

阅读全文 »

Deeplearning.ai 学习笔记 -- 浅层神经网络

发表于 2018-04-06 | 更新于 2018-04-08 | 分类于 人工智能 | 评论数:

0x01 神经网络的表示

首先要理解神经网络每一层的表示方法,搞清楚每个变量的意义,如下图:

阅读全文 »

Deeplearning.ai 学习笔记 -- Logistic Regression

发表于 2018-04-06 | 分类于 人工智能 | 评论数:

这一节教你手撸逻辑回归。
逻辑回归可以解决简单的二分类问题,比如下图的猫,通过一系列计算后得到它是猫的概率

阅读全文 »

Deeplearning.ai 学习笔记--基本概念

发表于 2018-04-06 | 分类于 人工智能 | 评论数:

对应《神经网络和深度学习.第二周.作业1》

归一化

很多非数学背景的同学不知道归一化有什么卵用。简单来说,向量可以表示方向和长度;通过归一化后,向量的长度 = 1,方向不变,使得向量仅代表特征的方向。优点是归一化后梯度下降得更快。(下图)

阅读全文 »

linux kernel bug 导致无法载入 nvidia 驱动

发表于 2018-03-23 | 更新于 2018-05-12 | 分类于 工作笔记 | 评论数:

执行 nvidia-smi 显示: NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

阅读全文 »

果然考外校的博士/硕士,还是难呀

发表于 2018-03-21 | 分类于 工作笔记 | 评论数:

阅读全文 »

RSA,KMP,AVL树,红黑树和LLRB-tree

发表于 2018-03-03 | 更新于 2018-03-05 | 分类于 工作笔记 | 评论数:

这三个算法是好几年前就好奇但一直没搞懂的神奇算法

阅读全文 »

最长公共子序列(LCS)到git diff

发表于 2018-02-28 | 更新于 2018-03-17 | 分类于 工作笔记 | 评论数:

当宿命从你门前走过的时候,芸芸众生总是显得那么渺小

0x00 LCS

最长公共子序列跟最长不降子序列以及最长公共字串都不是一回事。这种用搜索时间复杂度太高的问题一般都会选择用DP来解决。状态转移方程为:

$$c[i,j] = \begin{cases}
0, & i=0 \text{ or } j=0
\\ c[i-1,j-1]+1, & x_i =y_j
\\ max(c[i-1,j],c[i,j-1]), &x_i \neq y_i
\end{cases}$$

阅读全文 »

豫章书院与当代鲁迅的倒下

发表于 2018-02-13 | 更新于 2018-05-12 | 分类于 工作笔记 | 评论数:

有多少人,终其一生只为摆脱原生家庭


阅读全文 »

2017 年终总结

发表于 2018-01-02 | 更新于 2019-01-17 | 分类于 工作笔记 | 评论数:

2017年应该是最折腾的一年,为了传说中的梦想从深圳到了北京,离开了我超喜欢的一个领导,到计算所后由期待到失望…

时间过的很快,因为把时间都浪费在搬家和融入新团队中了。不过忙忙碌碌的好处就是没有时间发呆和难过了哈哈哈 >_<

阅读全文 »

《数据结构与算法分析》复习笔记

发表于 2017-12-06 | 更新于 2018-01-09 | 分类于 工作笔记 | 评论数:

不过我喝咖啡从来不是为了提神的 这个世界上唯一提神的东西就是你今天必须完成的事情呀

博士只考一门数据结构与算法分析,如果这都考不过那就真的重在参与了。本文把看完书以后手撸的代码贴出来,留个纪念。

阅读全文 »

通过MNIST熟悉Keras——《TensorFlow 实战》读书笔记

发表于 2017-10-16 | 更新于 2017-10-18 | 分类于 人工智能 | 评论数:

Tensorflow 的使用者虽多,但真的很难用。幸亏有基于TF和Theano的高层框架Keras(不幸的是Theano已经停止更新了)。我们通过MNIST来熟悉一下Keras。

先推荐一个学习线性代数的教程http://www.bilibili.com/video/av6731067/,不管你多忙也请看上面这个视频。
3Blue1Brown制作,深入浅出、直观明了地分享数学之美。

阅读全文 »

新工作:制作一个送咖啡机器人——调参

发表于 2017-09-01 | 更新于 2018-05-12 | 分类于 SLAM | 评论数:

调了一下午参数调到怀疑人生,最后发现是参数配置文件没有同步 - -
晚上遗留的一大堆Bug,第二天都自动消失了
肯定是有会写代码的海螺姑娘偷偷入侵了我的电脑 >_<

阅读全文 »

首版复刻的Fender '57 & '62 Strat 拾音器

发表于 2017-08-31 | 更新于 2018-01-15 | 分类于 音乐 | 评论数:

去年10月份左右从咸鱼买了一把号称93年产原装无修改的Fender vintage 57 stratocaster,拆开看了一下,琴颈的生产日期是1993.05.21,还挺有纪念意义的。但就在我买了新拾音器准备改装它的时候,好像发现了一个天大的秘密。

阅读全文 »

新工作:制作一个送咖啡机器人——第一周

发表于 2017-08-28 | 更新于 2018-05-12 | 分类于 SLAM | 评论数:

来北京一个月,一直蜗居在一个小屋里,没有钱花+前途迷茫的感觉真是浑身难受。
我现在的任务是接手之前几个客座生的项目,用Turtlebot做一个送咖啡机器人。第一周的时间用来搭建一个完整的demo

阅读全文 »

计算机视觉技术调查报告

发表于 2017-07-14 | 更新于 2018-01-15 | 分类于 图形图像 | 评论数:

本资源来自网络,侵权请按ALT+F4

阅读全文 »

Jetson TX-2 入门 -- 全部你应该知道的

发表于 2017-06-16 | 更新于 2017-08-28 | 分类于 硬件 | 评论数:

首先庆祝一下我用TX-1做实验写的《GPU加速与L-ORB特征提取的全景视频实时拼接》发表啦^_^
导师表示很开心,又给我买了两台TX-2

TX-2比TX-1除了性能的升级,其它部分没有太大变化,接下来要写的小技巧对于TX-1/2都适用。使用期间发现的问题都会持续更新到这篇博客,目前发现的问题有:

  • OpenCV4Tegra 不支持 -lopencv_nonfree
  • OpenCV4Tegra 在TX-2中不支持 GPU 模块
  • 如何开启被屏蔽的2块CPU并设置为最大频率
  • 开启Nvidia TX-1/2 的VNC
阅读全文 »

Softmax, MLP, CNN 三种方法识别手写数字MNIST——《TensorFlow 实战》读书笔记

发表于 2017-04-01 | 更新于 2018-01-15 | 分类于 人工智能 | 评论数:

不要代码写多了就变得那么没有人情味了

0x00 Intro

1. 读入MNIST数据库

执行mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)后,会检查MNIST_data/文件夹下有没有数据库文件,如果没有会自动下载。这一步如果执行比较慢,可以用迅雷手动下载下面四个文件,保存到MNIST_data目录(不需要解压)

  • train-images-idx3-ubyte.gz: training set images (9912422 bytes)
  • train-labels-idx1-ubyte.gz: training set labels (28881 bytes)
  • t10k-images-idx3-ubyte.gz: test set images (1648877 bytes)
  • t10k-labels-idx1-ubyte.gz: test set labels (4542 bytes)
阅读全文 »

HackRF 入门 -- GPS欺骗、GSM嗅探

发表于 2017-03-17 | 更新于 2018-01-15 | 分类于 信息安全 | 评论数:

上一节已经对HackRF升级了最新的固件,今天我们利用它做一些简单的实验。因为本人也是小白,所以本文并没有任何复杂的理论知识,只要会用Linux按照顺序一步一步操作都可以实验成功。

阅读全文 »

更新 HackRF one 到最新的 2017.02.1 固件

发表于 2017-03-16 | 更新于 2018-01-15 | 分类于 信息安全 | 评论数:

HackRF已经吃灰一年多了,官方的上一个版本还是2015.07,最新的2017.02.1版增加了Sweep mode,Hardware synchronization,hackrf_debug,降低了功耗以及修复了Bug. 在mossmann/hackrf/releases有编译好的固件hackrf-2017.02.1.tar.xz下载

阅读全文 »

(草稿)虎纹枫木、絮纹枫木形成的秘密

发表于 2017-03-09 | 更新于 2018-01-15 | 分类于 音乐 | 评论数:

原文:Go Figure! The Mystery of Figured Maple - By Mike Slubowski
http://www.gobywalnut.com/figured-maple.htm

阅读全文 »

2016 年终总结

发表于 2017-02-02 | 更新于 2018-01-15 | 分类于 工作笔记 | 评论数:

阅读全文 »

NVIDIA TX-1 的零拷贝(Zero Copy)和分页锁定内存(Pinned Memory)

发表于 2016-12-23 | 更新于 2018-04-07 | 分类于 图形图像 | 评论数:

公司发的圣诞礼物被一个自以为是的胖女人拿走了,不开心

众所周知GPGPU的性能瓶颈为PCI-E传输速度,数据传输时会导致运算资源闲置。因此NVIDIA发明了一个很牛逼的技术Zero Copy,它把主机内存直接映射到GPU内存上,在GPU需要数据时直接从主机内存寻找,隐式的传输到GPU中。还有另一个技术叫Pinned Memory,会在产生一个不会被分页的内存,这块内存不会被交换到磁盘的虚拟内存上,内存地址也不会被重新定位,因此,相比普通的Pageable Memory有更高的速度。使用Pinned Memory是一定会提高性能的,不过也需要适当使用,否则太多Pinned Memory会把Host Memory给挤爆了(因为它不会分页到虚拟内存去)。
图1 Pageable 和 Pinned 的区别

阅读全文 »

光流(Optical Flow)介绍

发表于 2016-10-25 | 更新于 2018-01-15 | 分类于 图形图像 | 评论数:

绝大部分摘自光流Optical Flow介绍与OpenCV实现,光流法介绍

光流是空间运动物体在观察成像平面上的像素运动的瞬时速度,是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。

阅读全文 »

[草稿]全景视频拼接关键技术

发表于 2016-10-16 | 更新于 2018-01-15 | 分类于 图形图像 | 评论数:

最近忙着写论文,没有时间写博客了。(说得就像会有人看一样)
现在的学术水平已经基本脱离“科学靠脑补、大力出奇迹”的民科状态了

阅读全文 »
123
S1NH

S1NH

no other developers required.

70 日志
8 分类
74 标签
RSS
程序员吐槽师 《Xcode 江湖录》 益行人 鲸落乐队
Creative Commons
Links
  • 一只猿
  • 本站 github 镜像
  • 本站国内镜像
0%
© 2015 – 2019 S1NH
由 Hexo 强力驱动
|
主题 – NexT.Gemini