- Nov 2023
-
www.semanticscholar.org www.semanticscholar.org
-
方法:
基础介绍:
考虑到现有模型还没有探索,什么样的Instruction数据集是更有效的,而且什么因素导致了好的Instruction data,暂未有人探索。 考虑到这些问题,作者探索什么是好的visual Instruction这个问题。基于这个目标,作者首先对现有的 visual Instruction set进行了评估,目标是发现关键因素。
作者主要从task type和Instruction characteristic两个方面来评估。作者选择了六个典型的Instruction dataset,使用两个典型的BLIP2和MiniGPT-4来评估。根据实验结果,作者发现: 1. 对于task type,视觉推理任务对于提升模型的image caption和quetison answering任务很重要。 2. 对于Instruction characteristic,提升Instruction的复杂度更加有帮助对于提升性能,相比task的多样性,以及整合细粒度的标注信息。
基于上述发现,作者开始构建复杂的视觉推理指令集用于改善模型。
首先最直接的方法是通过chatgpt和gpt4来优化指令集,基于图像的标注。因为指令集跨跨模态的特性,LLMs可能会过于简单甚至包含本来图片中不存在的物体。 考虑到上述问题,作者提出了一个系统的多阶段的方法,来自动生成visual Instruction数据集。
输入一张图,根据可以获得标注,caption或者object,作者采用了一种先生成,再复杂化,再在重组的pipeline来生成Instruction。具体的,作者首先,使用特殊的prompt指导prompt来生成一个初始指令。然后使用迭代的方式,复杂化-->验证的方式,来逐步提升Instruction的复杂程度,同时保证质量。最后,将Instruction重组成多种形式,在下游任务重,获得更好的适应性。
前提条件:
视觉指令收集:
任务类型,之前的指令微调的数据集,都是利用带有标注的图片。主要包括一下三个任务类型: 1. Image Caption,生成文本描述 2. VQA任务:需要模型根据问题生成关于图片的回答 3. Visual reasoning:需要模型基于图片内容进行推理。
为了研究任务类型的影响, 作者考虑一个最常用的指令微调数据集LLaVA-Instruct。作者将其划分成三个子数据集,LLaVA-Caption, LLaVA-VQA and LLaVA-Reasoning。
指令特性: 指令的特性包括。 * 任务的多样性,已经有工作发现,提升工作的多样性,对于zero-shot能力是有帮助的。可以通过和不同的任务整合来获得此类能力。 * 指令的复杂程度,这是一个被广泛应用的策略,提升LLMs指令集的复杂程度。作者同样使用复杂的多模态做任务,例如,多跳的推理任务,来提升MLLMs的指令遵循能力。 * 细粒度的空间感知。对于MLLMs而言,感知细粒度的空间信息对图片中的特定物体,是必要的。基于这个目标。空间位置的标注可以包括在有文本的指令集中。
-
- Jun 2023
-
www.masterspringboot.com www.masterspringboot.com
-
Monitoring Hikari Connection Pool
监控 Hikari 连接池
-
- Mar 2023
-
www.fivedata.cn www.fivedata.cn
-
是一个文件系统,用于存储文件,通过统一的命名空间目录树来定位文件; 其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
HDFS为文件系统
-
HDFS是一个主/从(Mater/Slave)体系结构,由三部分组成: NameNode 和 DataNode 以及 SecondaryNamenode: NameNode 负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信息。 DataNode 负责管理用户的文件数据块,每一个数据块都可以在多个 DataNode 上存储多个副本,默认为3个。 Secondary NameNode 用来监控 HDFS 状态的辅助后台程序,每隔一段时间获取 HDFS 元数据的快照。最主要作用是辅助 NameNode 管理元数据信息。
HDFS结构
-
- Dec 2022
-
stackoverflow.com stackoverflow.com
-
MySQL - Operand should contain 1 column(s) Ask Question
-
-
-
Spring Boot 处理 Long 类型的 json 数据,前端调用精度丢失,变成 00
-
-
-
ResultMap collection多层嵌套使用
-
-
blog.csdn.net blog.csdn.net
-
数据库设计基础-ER用例图
Tags
Annotators
URL
-
-
-
Mybatis-Plus逻辑删除&&自动填入默认值
-
-
-
MySQL / MariaDB 重置自增 ID (AUTO_INCREMENT)教程 - 完美保留表数据的终极解决方案
Tags
Annotators
URL
-
-
www.jianshu.com www.jianshu.com
-
Comparison method violates its general contract!
Tags
Annotators
URL
-
-
-
PowerDesigner 16.5 简单使用教程
Tags
Annotators
URL
-
-
-
使用Spring JPA中Page、Pageable接口和Sort类完成分页排序
Tags
Annotators
URL
-
-
blog.csdn.net blog.csdn.net
-
Jpa 自动更新表中的创建日期和修改时间
Tags
Annotators
URL
-
-
www.cnblogs.com www.cnblogs.com
-
Hibernate与MyBatis
Tags
Annotators
URL
-
-
blog.csdn.net blog.csdn.net
-
Mysql(多级分销)无限极数据库设计方案(邻接表,路径枚举,嵌套集,闭包表),并提供 嵌套集维持完整性程序 源码和SQL脚本
Tags
Annotators
URL
-
-
www.woshipm.com www.woshipm.com
-
如何从0-1设计产品分销体系?
Tags
Annotators
URL
-
-
www.cnblogs.com www.cnblogs.com
-
网站三级分销数据库如何设计,简单案例
Tags
Annotators
URL
-
-
www.coder.work www.coder.work
-
mysql - 如何链接一个分销商的产品表和多个零售网点的关系? mysql
Tags
Annotators
URL
-
-
learnku.com learnku.com
-
手摸手实现美团饿了么本地化生活项目CPS分销——设计数据库篇 0 3 0
Tags
Annotators
URL
-
-
juejin.cn juejin.cn
-
从用户端到后台系统,严选分销教会我这些事
Tags
Annotators
URL
-
-
dbaplus.cn dbaplus.cn
-
原创风采 企业专栏 专家专栏 年度MVP
-
-
-
Hibernate在控制台打印sql语句以及参数
Tags
Annotators
URL
-
-
zhongpan.tech zhongpan.tech
-
Spring Data JPA中多表联合查询最佳实践
-
-
blog.csdn.net blog.csdn.net
-
SpringBoot集成Druid监控页面最小化配置
Tags
Annotators
URL
-
-
alpinejs.dev alpinejs.dev
-
Re-usable Data
数据复用
-
-
www.zhihu.com www.zhihu.com
-
关于 mysql 的行锁 for update 的问题,请大神解答?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
MySQL数据库,数据表超过百万了查询速度有点慢。之后怎么存储呢?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
分布式事务选型该怎么取舍?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
常用的分布式事务解决方案有哪些?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
为什么在平均情况下快速排序比堆排序要优秀?
-
-
www.zhihu.com www.zhihu.com
-
如何评价极客时间上王争的「数据结构与算法之美」的爆火?
-
-
-
既然MySQL中InnoDB使用MVCC,为什么REPEATABLE-READ不能消除幻读?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
数据库MVCC和隔离级别的关系是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
乐观锁和 MVCC 的区别?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
SQL 语句的查询结果的的顺序是由哪些因素决定?
-
-
www.zhihu.com www.zhihu.com
-
如何根据sql语句逆向生成回滚语句?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
数据字典是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
Redis源码中hyperloglog结构的实现原理是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
研究者July在计算机和机器学习领域的水平怎么样?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何看待阿里9000万欧元收购Apache Flink母公司Data Artisans?
-
-
www.zhihu.com www.zhihu.com
-
Apache Flink和Apache Spark发展前景分别怎样?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何设计分销系统中 多级用户关系的 数据结构?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
到底什么情况下mysql innodb会发生回表操作?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
什么样的数据库设计才是优秀的?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
JAVA中直接用Jdbc就能操作数据库了,为什么还要用spring框架?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
MySQL把大表拆分成小表,是根据业务去拆分修改代码,还是使用mycat 之类的中间件,那种比较好?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
Spring Boot + MyBatis 如何优雅的实现数据库读写分离?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何评价DDIA作者的旧博文“Turning the database inside-out”?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
淘宝是如何实现高并发下抢单的锁单机制?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
为什么几乎所有的开源数据库中间件都是国内公司开源的?并且几乎都停止了更新?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
LeetCode按照怎样的顺序来刷题比较好?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
ebean.io ebean.io
-
Ebean
-
-
www.zhihu.com www.zhihu.com
-
MyBatis为什么在国内相当流行?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
2020年,java持久层怎么选择?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
MyBatis很落后吗?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何评价MyBatis-Plus?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
后端开发除了增删改查还有什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
为什么诸多编程语言都将模式匹配作为重要构成?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
大数据开发像Hadoop、Spark需要很强的数学和算法功底吗?
-
-
www.zhihu.com www.zhihu.com
-
微服务架构中如何解决连表查询的问题?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何评价开源数据库lealone的分布式事务模型?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
关于电商网站数据库的设计?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
京东、亚马逊之类的大型零售电商,商品分类的数据库是怎么设计的以满足查询的高效?
-
-
-
为什么数据库和数据库连接池不采用类似java nio的IO多路复用技术使用一个连接来维护和数据库的数据交换?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
函数式编程所倡导使用的「不可变数据结构」如何保证性能?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
MongoDB 等 NoSQL 与关系型数据库相比,有什么优缺点及适用场景?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何把任意的递归函数写成利用堆栈的非递归形式?
-
-
www.zhihu.com www.zhihu.com
-
如何在程序中将中缀表达式转换为后缀表达式?
Tags
Annotators
URL
-
-
github.com github.com
-
比起其他主题,自学数据库系统需要更多的付出。这是一个相对年轻的研究领域,并且出于很强的商业动机,研究者把想法藏在紧闭的门后。此外,许多原本有潜力写出优秀教材的作者反而选择了加入或创立公司。
-
-
www.zhihu.com www.zhihu.com
-
PingCAP 这家公司的前景如何?
-
-
www.zhihu.com www.zhihu.com
-
如何看待R大加入大数据公司Databricks?
-
-
www.zhihu.com www.zhihu.com
-
(list 1 2 3)为什么不可以是(cons (cons (cons nil 1) 2) 3)?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
有哪些算法惊艳到了你?
-
-
www.zhihu.com www.zhihu.com
-
如何让脑笨的人理解c语言指针和函数?
-
-
www.zhihu.com www.zhihu.com
-
如何简单易懂地解释 Lua 的元表(metatable)?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
刷完 LeetCode 是什么水平?能拿到什么水平的 offer?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何看待 Thomas Cormen 所说看完《算法导论》需要的时间?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何正确地撸《算法导论》?
-
-
www.zhihu.com www.zhihu.com
-
有人没事儿玩Hackerrank网站都拿到多高的rank了?
-
-
www.zhihu.com www.zhihu.com
-
如何理解动态规划?
-
-
www.zhihu.com www.zhihu.com
-
WeakHashMap中关于queue的疑惑 ?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
电商平台应该分析哪些数据?具体怎么去分析?
-
-
www.zhihu.com www.zhihu.com
-
为什么会有人写出几百行的SQL语句啊?这些人的心态是怎样的?为了凸显自己的强大吗?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何看待王垠对数据库的理解?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
怎样理解分析王垠文章《SQL,NoSQL 以及数据库的实质》的观点?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
Spark 千万级用户相似度计算?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何进入大数据领域,学习路线是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
MongoDB 应用场景?
-
-
www.zhihu.com www.zhihu.com
-
大数据公司 Splunk 和 Cloudera 的核心竞争力在哪里?
-
-
www.zhihu.com www.zhihu.com
-
数据库 与 数据仓库的本质区别是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
ORM是否必要?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
从编程语言设计的角度,如何评价SQL语言?
-
-
www.zhihu.com www.zhihu.com
-
关于幻读,可重复读的真实用例是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
为什么声明性语言往往适合于并行执行,命令代码很难在多个内核和多个机器之间并行化?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
JavaScript中对 function 的参数进行重新赋值的影响?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
JavaScript 有哪些常见的类数组 ?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何将一个 JavaScript 数组打乱顺序?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
Cache 和 Buffer 都是缓存,主要区别是什么?
-
-
www.zhihu.com www.zhihu.com
-
大学生如何实现一个数据库?
-
-
www.zhihu.com www.zhihu.com
-
现在有哪些比较好的轻量级的开源数据库Prototype?
-
-
www.zhihu.com www.zhihu.com
-
如何优化加快 SQL 查询速度 ?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
Lucene/ ElasticSearch这类的搜索引擎和SQL数据库里的查询/全文检索有什么区别?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
从百万级别数据的分析角度,Mysql,Mongodb,Hbase如何选择?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
我们为什么要使用Mysql处理读写分离?读写分离有什么优点?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
如何理解数据库事务中的一致性的概念?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
数据库事务原子性、一致性是怎样实现的?
-
-
www.zhihu.com www.zhihu.com
-
关于一个构造方法中this()和super()的执行顺序?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
乐观锁与悲观锁各自适用场景是什么?
Tags
Annotators
URL
-
-
www.zhihu.com www.zhihu.com
-
为什么Java的Hashmap比Python的dictionary慢得多?
Tags
Annotators
URL
-
- Oct 2022
-
app.yinxiang.com app.yinxiang.com
-
那么作为一名工程师,或者技术管理者,如何去利用有限的时间去培养这些思维和能力呢?
一是定目标的时候都尽可能量化。不要只是想着要 improve,enable,想想你具体 improve 了多少,enable 了什么。
二是动手搭一些简单的 dashboards去追踪你的目标指标。这样你就能随时观测你离你的目标有多少,从趋势上知道你做那些事对你的目标有最大的帮助。
三是保持一颗好奇心,看到设定好的数据有任何不是很理所当然的波动或者变化的时候,试着打破沙锅问到底,试试自己能不能去解读这些波动和变化。并且勤于动手去写一些简单的 SQL,知道数据的来龙去脉,知道每个数据的波动,其上游和下游可能受影响的数据还可能有哪些。
另外,如果组里有一名数据分析师或者数据科学家,不要觉得只是各做各的事,尝试着更紧密的合作和沟通,学习一些简单的技巧和思路,加上你对系统的实现有很好的了解,等你能够熟练运用一些简单的数据技能的时候,就会发现对彼此的工作都会有很大的帮助。
-
最后的结果就是组里不论任何大小决定,都用数据说话,决策过程也变得很透明。
-
给我印象最深的,是第一次听他在公司做报告的时候引用的 Peter Drucker 的一句话:“If you can’t measure it, you can’t improve it.” 这句话在后来的工作中多次的被印证,而很多时候,及时有效的一个数据分析,可以帮我们找到正确的方向,做改进最省力的办法,以及时刻帮助我们了解项目或者产品的好坏。
-
首先就是对各种 bug,incident,或者系统漏洞处理的优先级排序。以前我遇到别人报了一个问题,第一反应就是凭直觉去判断这个问题是因为什么,好不好修,怎么修,以及引发的可能性会不会很大。现在每遇到一个问题,第一件事就是去 “measure it”,这个问题影响到的人可能有多少,给公司带来的损失是多少。每个小时每天新的影响有多大等等。每个 bug report 上都有这样的 SQL query 和数据,然后团队就根据切实的数据去决定哪些问题是急事,哪些可以稍微放一放。这样一来团队始终都可以做到把问题控制在最小,而且对于略推后的问题心里也十分有底会有多大的影响。
-
- Aug 2022
-
funnylog.gitee.io funnylog.gitee.io
-
可见的行才能够用于计算“基于这个查询”的表的总行数。
Tags
Annotators
URL
-
-
www.cnblogs.com www.cnblogs.com
-
事务自动开启、提交或回滚,比如insert、update、delete语句,事务的开启、提交或回滚由mysql内部自动控制的
Tags
Annotators
URL
-
-
stackoverflow.com stackoverflow.com
-
ddl-auto
自动建表
-
-
www.elietio.xyz www.elietio.xyz
-
keepAlive解决druid空闲连接socket timeout 15分钟
-
-
time.geekbang.org time.geekbang.org
-
connection-timeout
获取连接超时
-