网站首页 站内搜索

搜索结果

查询Tags标签: 计算机视觉,共有 59条记录
  • LLM增强LLM;通过预测上下文来提高文生图质量;Spikformer V2;同时执行刚性和非刚性编辑的通用图像编辑框架

    文章首发于公众号:机器感知 LLM增强LLM;通过预测上下文来提高文生图质量;Spikformer V2;同时执行刚性和非刚性编辑的通用图像编辑框架 LLM Augmented LLMs: Expanding Capabilities through Composition本文研究了如何高效地组合现有的基础模型以实现新功能的问题,文…

    2024/1/6 5:32:29 人评论 次浏览
  • 基于开源模型搭建实时人脸识别系统(六):人脸识别(人脸特征提取)

    目录人脸识别的几个发展阶段 基于深度学习的人脸识别技术的流程 闭集和开集(Open set)识别 人脸识别的损失 Insightface 人脸识别数据集 模型选型 参考文献 结语 人脸识别系统项目源码前面我们讲过了人脸检测、人脸质量、人脸关键点、人脸跟踪,接下来就是人脸识别系统里…

    2023/12/27 1:32:57 人评论 次浏览
  • Opencv系列之一:简介与基本使用

    1 Opencv简介 Opencv是计算机视觉中经典的专用库,其支持多语言,跨平台,功能强大。Opencv-Python为Opencv提供了Python接口,使得使用者在Python中能够调用C/C++,在保证易读性和运行效率的前提下,实现所需的功能。 Opencv是由Gray Bradsky于1999年在英特尔创立,第一版…

    2023/10/17 14:03:11 人评论 次浏览
  • 浅谈OpenCV的多对象匹配图像的实现,以及如何匹配透明控件,不规则图像

    浅谈OpenCV的多对象匹配透明图像的实现,以及如何匹配半透明控件 引子OpenCV提供的templateMatch只负责将(相关性等)计算出来,并不会直接提供目标的对应坐标,一般来说我们直接遍历最高的相关度,就可以得到匹配度最高的坐标。但是这样一般只能得到一个坐标。 在实际操…

    2023/6/25 1:23:48 人评论 次浏览
  • 深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍

    深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍 1.LeNet(1998) LeNet是最早的卷积神经网络之一[1],其被提出用于识别手写数字和机器印刷字符。1998年,Yann LeCun第一次将LeNet卷积神经网络应用到图…

    2023/6/7 14:52:37 人评论 次浏览
  • 在树莓派上实现numpy的LSTM长短期记忆神经网络做图像分类,加载pytorch的模型参数,推理mnist手写数字识别

    这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是LSTM识别mnist手写数字识别 训练代码在电脑上,cpu就能训练,很快的:import torch import torch.nn as nn import torchvision import numpy as np import os from PIL import…

    2023/5/31 14:22:05 人评论 次浏览
  • 在树莓派上实现numpy的conv2d卷积神经网络做图像分类,加载pytorch的模型参数,推理mnist手写数字识别,并使用多进程加速

    这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是卷积识别mnist手写数字识别 训练代码在电脑上,cpu就能训练,很快的:import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, t…

    2023/5/31 1:23:41 人评论 次浏览
  • 在树莓派上使用numpy实现简单的神经网络推理,pytorch在服务器或PC上训练好模型保存成numpy格式的数据,推理在树莓派上加载模型

    这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是mlp识别mnist手写数字识别 训练代码在电脑上,cpu就能训练,很快的:1 import torch2 import torch.nn as nn3 import torch.optim as optim4 from torchvision import dataset…

    2023/5/30 18:22:21 人评论 次浏览
  • GroundingDINO(一种开集目标检测算法)服务化,根据文本生成检测框

    背景 最近发现一个叫GroundingDINO的开集目标检测算法,所谓开集目标检测就是能检测的目标类别不局限于训练的类别,这个算法可以通过输入文本的prompt然后输出对应的目标框。可以用来做预标注或者其他应用,比如我们要训练某个细分场景的算法时,我们找不到足够的已经标注…

    2023/5/27 1:23:27 人评论 次浏览
  • 深度学习炼丹-不平衡样本的处理

    前言 一,数据层面处理方法 1.1,数据扩充 1.2,数据(重)采样 数据采样方法总结1.3,类别平衡采样二,算法(损失函数)层面处理方法 2.1,Focal Loss 2.2,损失函数加权参考资料 前言 在机器学习的经典假设中往往假设训练样本各类别数目是均衡的,但在实际场景中,训练…

    2022/12/9 4:24:59 人评论 次浏览
  • 深度学习-第五章机器学习基础

    前言 5.1 学习算法 5.1.1 任务 TTT 5.1.2 性能度量 PPP 5.1.3 经验 EEE 5.1.4 示例: 线性回归5.2 容量、过拟合和欠拟合 5.2.1 没有免费午餐定理 5.2.2 正则化5.3 超参数和验证集 5.3.1 验证集的作用 5.3.2 交叉验证5.4 估计、偏差和方差 5.4.1 点估计 5.4.2 偏差 5.4.4 权…

    2022/12/3 4:23:57 人评论 次浏览
  • 「游戏引擎 浅入浅出」4. 着色器

    「游戏引擎 浅入浅出」是一本开源电子书, 着色器就是Shader,Shader就是一段GPU程序源码。 我们大学就学过的C语言是CPU程序源码,Shader和C 语言有很多相似之处,也要写代码、编译、链接。 通过下面的表格来做对照。C语言 Shader 目标硬件 CPU GPU 编译流程 创建项目 创…

    2022/7/28 4:22:43 人评论 次浏览
  • 深入浅出 Yolo 系列之 Yolov7 基础网络结构详解

    从 2015 年的 YOLOV1,2016 年 YOLOV2,2018 年的 YOLOV3,到 2020 年的 YOLOV4、 YOLOV5, 以及最近出现的 YOLOV6 和 YOLOV7 可以说 YOLO 系列见证了深度学习时代目标检测的演化。对于 YOLO 的基础知识以及 YOLOV1 到 YOLOV5 可以去看大白的 YOLO 系列,本文主…

    2022/7/22 4:22:51 人评论 次浏览
  • 用cmd命令进行磁盘清理(主要是系统盘)

    作用:清理磁盘(主要是系统盘)中不需要的垃圾文件 操作方法: 第一步:Windows键+R键 调出cmd命令窗口(窗口图如下:) 第二步:输入框中输入cmd命令,按下Enter键,进入如下图界面: 第三步:在以上界面输入cleanmgr,按下Enter会出现以下界面 第四步:直接点确定出现下…

    2022/7/14 3:20:08 人评论 次浏览
  • 006 | 播放器系列专栏-在 Mac 上查看 MP4 格式信息

    之前介绍了在 Windows 上查看 MP4 格式信息,使用的是 Mp4 Explorer 软件,具体使用如下: 005 | 播放器系列专栏-在 Windows 上查看 MP4 格式 现在该介绍一下 MAC 上用的软件了,它就是 MediaInfo 软件,官网地址如下: https://mediaarea.net/MediaInfo 使用起来也很简单…

    2022/5/11 8:53:59 人评论 次浏览
共59记录«上一页1234下一页»
扫一扫关注最新编程教程