Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

Posts

Mixed precision training

7 minute read

Published:

Source: https://forums.fast.ai/t/mixed-precision-training/20720

3D Object Detection Overview till 2019.3

less than 1 minute read

Published:

某次 paper reading 我准备的内容,主要是梳理了一下最新的 3D Object Detection 的进展,列出了我认为重要、有代表性的一些工作。

让 VIM 替代你的 IDE

less than 1 minute read

Published:

最近一段时间,主要的开发工作都在 server 上进行,除了一些实在不方便在 server 上运行的 codes,比如标注工具等,日常打交道最多的还是编辑器,在这三个月左右的时间里,我更换了两三次编辑器,在本篇文章中,我将介绍这一过程,以及如果你像我一样也喜欢 vim,我将在本文中说明如何自定义你的 vimrc。

Domain Adaptation - A Survey

less than 1 minute read

Published:

Domain Adaptation 是迁移学习的一个分之,其主要解决数据分布有差异的问题,更精确地说就是 covariance shifts,前几天在小组内部做了一次分享,感觉也可以讲 ppt 的内容放到专栏中来,毕竟里面也不涉及任何跟公司有关的信息,也不是我在公司做的项目,而是结合之前的实习经历,以及自己平时的积累做的一个总结,因此希望能够对更多的人有所帮助。

How Python’s import works

21 minute read

Published:

I’ve almost never been able to write correct Python import statements on the first go. Behavior is inconsistent between Python 2.7 and Python 3.6 (the two versions that I test here), and there is no single method for guaranteeing that imports will always work. This post is my dive into how to resolve common importing problems. Unless otherwise stated, all examples here work with both Python 2.7 and 3.6.

Edc

1 minute read

Published:

从学校毕业后,迎来了又一次的设备更新,在这之前,我在用的设备有 Macbook Pro mid 2014 15‘4’‘,iPhone 7 Plus + 坚果 Pro 2,耳机从年初开始,我就基本弃用了所有有线耳机,转而买入了 Airpods,当时购买它的主要原因是,我的 workstatoin 使用 3.5 mm 耳机口,坚果使用 type-c 接口,手机使用 lightning 接口,这几乎让我感到崩溃,因此准备从接口的束缚中解脱出来。买来之后的使用体验还是非常好的,感觉是最值得买的产品,当然,前提是搭配其他 Apple 设备使用,才能有最好的体验。

DenseBox

less than 1 minute read

Published:

Depwise separable filters.

Towards Autonomous Driving related Computer Vision - I

less than 1 minute read

Published:

这是我继《本科深度学习及求职经验分享》后的第二个 Live,这次想聊点具体的技术问题,同时,我想把它作为我今年一个系列 Live 的开篇,关于计算机视觉和自动驾驶。一方面,为对这方面有兴趣的同学提供一个 smoothly 入门以及深入的 path,另一方面,也是我在这个领域不断学习和实践的总结,这样也可以让各位可以 keep tracking of state-of-the-art progress,当然,还有一方面是可以通过这一系列 Live 结交更多朋友。

RAID

less than 1 minute read

Published:

Example

算法实习这一年(三)

less than 1 minute read

Published:

前面已经详细回忆了我在过去一年的经历,这篇文章中,我想写一下关于选择的问题,以及一些题外话。

算法实习这一年(二)

1 minute read

Published:

2017.07 开始到现在(2018.03),贯穿始终的就三件事:实习、面试和搬家。

Single Shot Multibox Detector

2 minute read

Published:

SSD 算法是一种直接 predict bounding box location by regression 和 predict object class by classification 的 object detection 算法,compared to Faster-RCNN,去掉了 bounding box proposal 以及后续的 pixel/feature resampling。运算速度比起 Faster RCNN 快很多,准确率也要高,it holds when compares to YOLO,当时拿到了 Pascal Object Detection 比赛的 top 1,不过现在已经又被 YOLO9000 等算法超越了。

A Survery on Edge Detection

less than 1 minute read

Published:

经过我最近几天的调研,并阅读了下面的论文和相关视频演示,得出的结论是,完全可以只依赖神经网络实现边缘检测,具体方法有 卷积神经网络、卷积后跟反卷积 等,可以使用常见的公开数据集,加以处理后扩充已有的有标记数据集,可以使用 pretrained models 来指导神经网络的训练,而且可以利用迁移学习的知识,扩大目标检测的范围,及模型的适用范围。

Mac Tricks

less than 1 minute read

Published:

App Download sites

Transfer Learning

less than 1 minute read

Published:

基于定义的 TL 分类:

Domain Adversarial Training of Neural Networks

less than 1 minute read

Published:

Learning a discriminative classifier or other predictor in the presence of a shift between training and test distributions is known as domain adaptation(DA).

Time delay neural network

less than 1 minute read

Published:

TDNN 是一种 ANN 结构,其主要目的是处理 sequential data。TDNN 的 units 独立于时间位移(i.e. sequence position)识别特征,通常用于组建一个更大的模式识别系统。例如,将连续的音频转换为分类号的音素(phoneme)标签 stream 来做语音识别。

GAN from 0 to 1

less than 1 minute read

Published:

This post contains all you need to learn Generative Adversial Networks, including video, tutorials and related papers.

TensorFlow RNN tutorial for Speech Recognition

12 minute read

Published:

In this post, we’ll provide a short tutorial for training a RNN for speech recognition; we’re including code snippets throughout, and you can find the accompanying GitHub repository here. The software we’re using is a mix of borrowed and inspired code from existing open source projects. Below is a video example of machine speech recognition on a 1906 Edison Phonograph advertisement. The video includes a running trace of sound amplitude, extracted spectrogram, and predicted text.

less than 1 minute read

MXNet Tutorials - NDArray, Symbols, Module, Iterator

less than 1 minute read

Published:

In MXNet, NDArray is the core data sturcture for all mathmatical computations. AN NDArray represents a multidimensional fix-sized homogeneous array, just like numpy.ndarray. And it enables imperative computation.

智能剪刀

9 minute read

Published:

智能剪刀 实验报告

Configure OpenMP & MPI in Clion on Mac

5 minute read

Published:

I’ve been taking the course Parallel Computing this semester, therefore I want to configure Open MP and MPI on my Mac. This post describes how I configured OpenMP using Homebrew and built from MPI source successfully.

Petri 网基础

less than 1 minute read

Published:

Petri 网起源:

SIFT Theory and Practice

less than 1 minute read

Published:

Matching features across different images in a common problem in computer vision. When all images are similar in nature (same scale, orientation, etc) simple corner detectors can work. But when you have images of different scales and rotations, you need to use the SIFT(Scale Invariant Feature Transform).

Tensorflow Installation on OS X 10.11.6 with GPU support

8 minute read

Published:

现在 Tensorflow 已经出了 1.0 的正式版,此教程更新至此版本。

很早之前就出了 caffe 的安装步骤教程,迟迟没有出 tf 的教程的原因是之前装了很多次,但是完全装好 tf 只有一次,而且还是迷迷糊糊装好的,所以不能保证步骤一定能够复现。今天又试了一次,终于大功告成。

A tutorial on PCA

1 minute read

Published:

This tutorial doesn’t shy away from explaining the ideas informally, nor does it shy away from the mathematics. It addresses both of them.

CS231n-lecture1

less than 1 minute read

Published:

CS231n focuses on one of the most importantproblems of visual recognition – image classification.

Ubuntu Server Configure Shadowsocks

less than 1 minute read

Published:

由于Ubuntu Server是不带用户界面的,所以要为Server配置Shadowsocks还是稍显麻烦。本文就是我配置Shadowsocks的一些经验,以待参考。

小米路由器 3 安装 Shadowsocks

less than 1 minute read

Published:

  1. 从 https://github.com/poodarchu/miwifi_ss 下载所需的文件,上传至小米路由器 3 中。
  2. 更改 miwifi.sh 和 shadowsocks_r3.tar.gz 的权限
  3. 执行 ./miwifi.sh
  4. 输入代理服务器的配置信息,安装成功。
  5. 输入 top 命令,可以看到 ss-dier 进程
  6. 输入 /etc/init.d/ss start 开启 shadowsocks,输入 /etc/init.d/ss stop 终止进程。

Faster R CNN

7 minute read

Published:

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

LaTeX Tutorial

2 minute read

Published:

这是我的 LaTeX 入门笔记,仅供参考。源文件中引用的图片等资源文件并未上传。

Universities List

less than 1 minute read

Published:

  • 威斯康星大学麦迪逊分校

记 MSD-Audio 漂洋过海来到中国

less than 1 minute read

Published:

今年(2016)的五月,我给自己挖了个当时不知道多深的坑:做一个关于基于音频的音乐推荐的项目。

深度学习的过往

less than 1 minute read

Published:

表示学习(representation learning)系统中,直接以原始数据的形式提供机器输入,自动发现用于检测和分类的表示 Representation。深度学习是一种 多层表示学习 方法,用简单的非线性模块构建而成,这些模块将上一层表示(从原始数据开始)转化成更高层、更抽象的表示。当一个学习系统有足够多这样简单的非线性模块构建而成时,就可以有十分强大的学习能力。

t-SNE 高位数据可视化

less than 1 minute read

Published:

t-distribution:

t-分布通常用于从小样本估计总体呈正态分布且方差未知的整体的均值。如果总体的方差已知,例如在样本数量足够多时,应该用正态分布。

它是对两个样本均值差异进行显著性测试的学生t检定的基础。

CUDA 详解

6 minute read

Published:

什么是 CUDA?

A step by step RNN tutorial

20 minute read

Published:

最近接到指导老师给的“看一下LSTM”的任务。

虽然之前已经了解过LSTM以及RNN的基本原理和适用范围,但是还没有写过代码,因此通过这个机会,将RNN以及LSTM及其变体,更详细的了解一下,并尽量将其实现。

Ubuntu Server Configuration

1 minute read

Published:

由于之前配置过很多刚刚装好系统的服务器,现为避免日后再次配置的麻烦,将从零开始配置的步骤总结如下。

Matrix Derivation - 矩阵求导

less than 1 minute read

Published:

求导公式(撇号为转置):

Y = A * X –> DY/DX = A’ Y = X * A –> DY/DX = A Y = A’ * X * B –> DY/DX = A * B’ Y = A’ * X’ * B –> DY/DX = B * A’

乘积的导数

d(f*g)/dx=(df’/dx)g+(dg/dx)f’

VS 2013 配置 OpenCV 2.4.13

less than 1 minute read

Published:

作者本人从刚开始接触编程就一直在使用OS X操作系统,因此对VS的具体使用并不熟悉,以下是近期在Win上安装OpenCV的摸索过程总结。

How Qt5, OpenCV 2.4 and Clion integrate with each other - On OS X?

3 minute read

Published:

以下内容均为我在给我的MacBook Pro配置环境时的详细记录,并不一定保证适用于其他任何电脑,但我相信肯定有参考价值。

操作系统版本:OS X 10.11.6

Qt 版本:Qt 5.7

Clion 版本:Clion 2016.2

OpenCV 版本:OpenCV 2.4.13

QT 的信号与槽机制介绍

5 minute read

Published:

QT 是一个跨平台的 C++ GUI 应用构架,它提供了丰富的窗口部件集,具有面向对象、易于扩展、真正的组件编程等特点,更为引人注目的是目前 Linux 上最为流行的 KDE 桌面环境就是建立在 QT 库的基础之上。QT 支持下列平台:MS/WINDOWS-95、98、NT 和 2000;UNIX/X11-Linux、Sun Solaris、HP-UX、Digital Unix、IBM AIX、SGI IRIX;EMBEDDED- 支持 framebuffer 的 Linux 平台。伴随着 KDE 的快速发展和普及,QT 很可能成为 Linux 窗口平台上进行软件开发时的 GUI 首选。

K-Means聚类算法

less than 1 minute read

Published:

K-Means 是最简单的无监督学习算法之一,用于解决我们熟知的聚类问题。整个过程基于一定的先验,将一个给定的数据集分成数个clusters(比如k个)。该算法的主要思想是

深入理解 LSTM

less than 1 minute read

Published:

Recurrent Neural Networks

projects

vimrc

Published:

Custom vimrc for python users

Det3D

Published:

A general 3D object detection framework featuring diverse models & datasets support and superior performance.

cvpack2

Published:

A high efficient 2D object detection framework

publications

talks