在当前文件夹创建git目录 添加当前文件夹的文件或确认文件修改(未保存) 添加该文件夹所有文件 删除当前文件夹的文件(未保存) 保存并说明 查看之前的更改 添加密钥 然后将.ssh文件夹里的id_rsa.pub文件内容复制粘贴到GitHub的设置里面 设置本地用户名和邮箱 添加远程服务器 查看远程服...
技术 2018年9月21日(2025.10.5更新)最近在学习 MLIR,一开始学的是 MLIR 官方的 Toy Tutorial,但总感觉不得要领。后面在 Github上看到了北京大学周可行写的 MLIR-tutorial,非常清晰易懂,成功跟着做了一遍。在这里记录一下我在跟教程的过程中遇到的一些问题。顺便一提...
技术 2025年6月29日课题组最近的项目需要用到华为的昇腾计算卡,和CUDA汗牛充栋的教程和文档相比,作为一款比较新的计算卡产品,昇腾在网上基本没什么教程,可以参考的只有官方文档、官方代码仓库和官方论坛。因此我在使用的过程中,也经过了很多探索...
技术 2024年10月1日最近做一个FPGA加速项目,不想写HDL,所以又选择了HLS。之前的文章《Ultra96V2开发板简单使用》中介绍了如何用HLS写IP核并且在Ultra96V2开发板上通过Pynq环境跑起来,但是我现在用的是OpenSSD开发板...
技术 2024年6月30日最近在做基于图的近似向量检索的实验,需要用到Faiss库和Rapids系列的Raft库,同时由于要统计一些算法内部的数据,因此不能直接使用它们预编译的Python库,而要手动从源码编译并通过C++调用...
技术 2024年5月8日最近在实现一个通过PyTorch Extension扩展PyTorch算子的C++算法,需要分析代码的运行瓶颈进行针对性优化。Intel VTune就是一个能从汇编级和源码级分析CPU运行瓶颈的工具。由于不明原因我没在服务器上跑通命令行版的VTune...
技术 2024年1月1日最近帮老师做一个硬件项目,使用SpinalHDL实现。实际用起来还是觉得这玩意不错,它能够抽象到“生成Verilog代码”这一层面,通过程序简化生成的逻辑,可以减少很多直接用Verilog需要编写的重复代码...
技术 2023年11月26日在探索新的深度学习算法的时候,我们可能会遇到PyTorch提供的算子不能满足需求的情况,这时候就需要自定义PyTorch算子,将我们的算法集成到PyTorch的工作流中。同时,为了提高运算效率...
技术 2023年9月2日背景 最近从不同网站下载了非常多的动漫壁纸,其中有一些内容相同,但是大小、背景颜色、色调、主人公的位置不同(例子如下)。正因为如此,基础的均方误差、直方图检测等方法很难识别出这些相似的图片。 思路 OpenCV中有很多用来对特征点进行检测和计算的函数,这些函数能够利用像素点及其周围的灰度检测其是否是...
技术 2019年8月10日(2023.5.27更新)