乱谈府

RAG相关知识

Thu, 6 Jun 2024 14:58:00 GMT

RAG 的一些学习参考，主要基于 Lance Martin 的介绍，随时更新。

RAG 定义

RAG（retrieval-augmented-generation）。检索增强生成（RAG）是指对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。
从技术上讲，RAG是基于知识库检索的提示词增强技术。
根据用户输入的信息在数据库中进行查询，将与查询相关的数据，加入到提示词的上下文中，从而提高模型的回答质量。

这里整理一个基于 langchain 的 RAG 介绍视频教程
GitHub - langchain-ai/rag-from-scratch
RAG From Scratch - YouTube

RAG整体流程和相关技术图如下

Basic idea

Indexing

通常需要加载数据，分割数据，嵌入操作，这会让后续的 retrieve 操作变得更加方便。
分割（splitting）是因为模型实际上下文窗口是有限的，切分成小块以适应模型。
问题和参考文件都要进行 embedding 操作，转化到向量空间表达（vectorstore）。即使句子没有那么长，embedding 还是会统一到一个固定的向量长度的。

Retrieval

问题和参考文件在进行 index 后，它们共同被转化到更高维度的空间，在此空间中计算相似度以查找和问题相似的参考文件。当然可以寻找很多个（参数中可以定义）相似度高的文件预料作为备选使用。

Generation

将 retrieve 得到的文档放入 LLM 上下文窗口中，进一步得出答案。这一步需要用到 prompt。通常是构建一个 prompt template，将问题和得到的文档按照一定格式输入 LLM ，进行 chatmodel，之后解析为字符串后即可得到答案。

Langchain 中可以轻易的构建 chain，进行一系列操作。使用 invoke 等方法调用 chain

一段简单的流程代码：

import bs4
from langchain import hub
from langchain_chroma import Chroma
from langchain_community.document_loaders import WebBaseLoader
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter

# Load, chunk and index the contents of the blog.
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_only=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)
docs = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# Retrieve and generate using the relevant snippets of the blog.
retriever = vectorstore.as_retriever()
prompt = hub.pull("rlm/rag-prompt")


def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)


rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

rag_chain.invoke("What is Task Decomposition?")

整体例子和理解可以参考 Build a Retrieval Augmented Generation (RAG) App | 🦜️🔗 LangChain

以下为基于 RAG 流程的一些优化的方法，仅作简单解释，自己也不是太懂，随时学习补充。

Query Translation

对于初始输入的问题，可以以某种特定的方法翻译或修改为更好的内容，以改进检索的过程。

Multi Query

其中一种方法是转换一个问题至很多不同角度的问题，本质上是一种重写（rewritten）。至于如何转化为多个角度的问题，可以直接交给 LLM。

RAG from scratch: Part 5 (Query Translation -- Multi Query) - YouTube

RAG-Fusion

和 multi query 类似，不过在向量化计算相似度之后，进行了一种排序（rank）来检索文档，称为 rank Fusion。

RAG from scratch: Part 6 (Query Translation -- RAG Fusion) - YouTube

Decomposition

Decomposition（Least-to-most prompt context）
将原始的问题分解成多个子问题，并依序解答问题。联合上一个问题得到的答案和这一个问题共同作为预料进行回答。至于如何分解成有嵌套关系的子问题，同样可以直接交给大模型。

IR-CoT: Interleave retrieval with CoT
动态检索以帮助解决子问题，有点 stacking 的味道。

RAG from scratch: Part 7 (Query Translation -- Decomposition) - YouTube

Step-back prompting

通过提问基于该问题的更抽象层面的问题来改善原始问题。
RAG from scratch: Part 8 (Query Translation -- Step Back) - YouTube

HyDE

借助 LLM ，基于问题生成一部分具有参考意义的文档或论文参考，作为假设文档。联合假设文档和自己提供的文档作为语料，让 LLM 回答问题。
RAG from scratch: Part 9 (Query Translation -- HyDE) - YouTube

Routing

Rounting（路由）的作用是假设有很多的数据库，基于得到的问题，能够将问题分配到合适的数据库中进行后续处理。

Logitic routing

基于不同的库，将输入问题转化为一个结构化对象，对象的输出在不同的几个库中，
RAG from scratch: Part 10 (Routing) - YouTube

Semantic routing

将多个 prompt 嵌入，和问题一起计算相似度，选择相似度高的 prompt 进行后续的问题回答。

这时 LLM 在回答问题的同时，还会返回基于问题的对象。

Query Structuring

目标是将输入的自然语言问题转化为结构化的查询，可以应用于向量存储层面的元数据过滤器。

可以用来作为结构化查询使用
RAG from scratch: Part 11 (Query Structuring) - YouTube

Indexing

Multi -representation

借助 LLM 对原始的文档进行总结并分割，类似于一种蒸馏

原始文档使用 LLM 总结后放入向量空间，联合原始的文档，进行最终的检索。
RAG from scratch: Part 12 (Multi-Representation Indexing) - YouTube

RAPTOR

有些信息可能需要来自很多的文件才能得到。这时候可以考虑如下思路，先用聚类的思想，将原始文件分为几块并形成摘要，可以继续抽象到更高层面摘要，逐级进行递归。这样等于是从细致到抽象层面都有非常广的覆盖范围，之后将这些部分共同向量化存储。
RAG From Scratch: Part 13 (RAPTOR) - YouTube

ColBERT

RAG From Scratch: Part 14 (ColBERT) - YouTube

Retrieval

Cohere ReRank

在进行 embedding 后进行搜索时，根据用户问答对语料进行一定程度的排序。

# ReRank 与 Embedding 模型的区别？如何选择 ReRank 模型？
聊聊QAnything之二阶段检索(粗召回与精排) | 极客之音
 GitHub - netease-youdao/QAnything: Question and Answer based on Anything.

Corrective RAG

Building Corrective RAG from scratch with open-source, local LLMs - YouTube langgraph/examples/rag/langgraph_crag_local.ipynb at main · langchain-ai/langgraph · GitHub

将每一部分抽象为一个节点。借助 langgraph 可以快速构建。
使用 jsonmode，借助 LLM 模型，针对问题对每一段预料其进行结构化的筛选，设定特定字符如 score 再进行后续的操作。例如，score 表示该预料是否和问题相对符合，输出为 yes/no。如果模型判断 score=True，将对应预料保留。如果不是，进行一些 web_search 等操作进行文档补充。最终使用 LLM 进行结果输出。

Embedding models

Embedding models · Ollama Blog
# 如何选择RAG的Embedding模型？
Acge 模型效果比较好

# 下载模型
ollama pull chevalblanc/acge_text_embedding

# 运行模型
from langchain_community.embeddings import OllamaEmbeddings
vectorstore = Chroma.from_documents(documents=splits, embedding=OllamaEmbeddings(model="chevalblanc/acge_text_embedding"))

如何选择RAG的Embedding模型？_哔哩哔哩_bilibili

总结

可以发现，很多技术本身是依赖与 LLM 本身的性能。如果想构建一个性能优异的 RAG 系统，还是得选择一个靠谱的模型。

其他参考

Conversational RAG | 🦜️🔗 LangChain
关于 pydantic 类 Welcome to Pydantic - Pydantic
# RAG共学一：16个问题帮你快速入门RAG

游戏 Animal Well

Wed, 29 May 2024 15:42:00 GMT

你应该或多或少看过或者上手玩过一些解谜游戏，或是纯粹解谜为主，类似锈湖系列，room 系列，纪念碑谷等等。或是类银河战士恶魔城游戏，在偌大的地图中探索，不断升级获得新能力，再进行新的探索。有些解谜基于游戏本身，你在自己解谜完成后会有一种小快感，有些麻烦的尝试后可能会在网上搜索答案，然后感叹谜题之精妙。更有构思复杂的谜题，在一环一环的嵌套破译后，你会惊呼是神作。然后还有一类谜题超出了游戏本身，他可能打破第四面墙，达到作者与玩家的直接沟通，或者疯狂的将游戏内容拓展到现实。

最近玩了一款新像素风类银河战士恶魔城游戏，animal well，直译过来就是动物井。作者 Billy Basso 经过七年的独立开发最终问世。游戏 steam，switch 和 ps 平台都有。游戏很小仅有不到 40M，据说还是作者自己开发的引擎，但内容真的惊为天人，游戏设计之精妙，谜题难度之离谱，我个人评价是满分 10 分的佳作。

游戏的地图十分大，而且是左右上下连通的，这算是亮点，但不算新意。我之前玩过的好狗狗星系才是真正把这种连通地图做成游戏特色。游戏初始操纵着软糖人（个人称呼）在地图中探索。在途中你会收集各种各样的东西，获得不一样的能力，借助能力你就能去一些你之前无法探索的地形。听起来很俗套，但是真正游玩的时候，不同能力的搭配会达成一些操作，你会惊呼，同一个谜题原来可以这样解，又可以那样解，而这要求的操作难度是大大不同的，颇有一种塞尔达神庙解谜的感觉。但是你以为自己发现了游戏中的bug，可以用某种方式去无限作弊时，你又会发现，其实作者早就设置好了障碍，这一切都在他的计算之中。

庞大的地图和渺小的我

游戏中期可以获得一个道具笛子，通过不同的方向可以吹出不同的韵律，而特定的韵律就可以触发特殊的效果。这就导致游戏中蕴含着很多隐藏谜题。无论是收集64颗蛋后，破译出64音符的旋律解锁重要道具，又或者全图寻找16只兔子，之后再次根据兔子耳朵结合四进制信息破译方向信息，抵达最终之地。你都会惊呼，这难度和隐藏度已经到了非人的境界。

更为疯狂的是，游戏中一些独特操作会产生一些特殊编码，然而他们都是有意义的，收集全部内容完成拼接，会得到一个地图，而地图的最终之地，居然是作者和玩家的对话录音，这切切实实打破了第四面墙。这终极的谜题，在全网玩家探索努力下居然三天就破译出来了，不得不感叹网络和群众的力量。尽管如此，游戏还有许多细小的彩蛋等待探索。你永远不知道作者藏了多少东西。
有兴趣的可以看看 b 站上的相关解谜视频，剩下的只剩感叹：
动物井寻找农场巨兔以及解谜原理 ANIMAL WELL 预定年度最佳探索类银河恶魔城
 动物井真结局最疯狂的谜题以及解谜原理开发者录音 ANIMAL WELL 预定年度最佳探索类银河恶魔城

我在switch平台购买游玩的游戏，现在大概12小时游戏时间，仅仅全收集了蛋，兔子谜题和第四面墙实在是过于复杂了，不是我能独立解决的，后面的内容看视频云完了。实际我是 2D 跳跃类型游戏的手残党，玩这个游戏有些地方还是受了点苦头的，特别是你在漫长跳跃尝试后因为一个失误失败重来，真的非常烦躁。不过好歹还不算太难，达成之后有一种非常强的满足感。玩游戏的时候打开地图，你会好奇地探索着任何一个黑色的区域，因为基本上所有的区域都有隐藏的东西，他们就如同一个个小手勾引着你将他们全部挖掘。作为一个独立游戏，在保证趣味性和探索性的同时，能够不断让你发出惊呼，这种惊喜让生活充满了乐趣。你也能够感受到开发者的硬核和设计良苦用心。这时一个好游戏，值得大家都去感受一下，不过 steam 上售价 85 米，不着急还是可以等等打折再入手吧。

追逐战的猫猫截图，说实话有点吓人

旅程——香港

Tue, 14 May 2024 15:27:46 GMT

作为一个生活在中国的普通人，能有一个长假期不容易。趁着五一假期，和女朋友和另一位好朋友一起开启一段香港之旅。

DAY1 过关然后落寞离场

去香港的第一步是过关。从合肥出发，乘坐 6 点 40 的飞机，于 8 点半左右到达深圳。我们的路线是前往福田口岸过关。可能是由于深圳香港天气不好的原因，口岸没有想象中五一那种流量，轻轻松松基本没有排队便到达了香港境内——落马洲站。

入境后香港这边也是有雨，先乘坐地铁到酒店。香港的地铁也算方便，在 iphone 上开通了八达通后，体验基本和国内一致。在一路换乘颠簸之后，我们终于到达位于荃湾附近的酒店。淅淅沥沥的小雨打湿了行李箱，不过也打走了假期拥挤的氛围。

我们这一行的目的是来看五月天五月一日的香港演唱会，可以说是为了这盘醋包了这顿饺子。在我去附近的取票机取了票后，已然下午1点左右。当下还是得吃点东西来填饱肚子，在休整一番后，我们乘坐酒店巴士到附近的新都会广场。这里我们吃了一家越南菜芽庄。整体来说是我了解的那种臭臭又香香的感觉，肉很香，酱很上头。

吃饱喝足后，我们向着演唱会的地点中环附近前行。在快到达场馆附近时，突然收到了因为器材和天气原因演唱会推迟到9号到噩耗。当时瞬间感觉如此的不真实但又不得不接受这样的结果。看着中环附近的巨大的摩天轮和同样得到消息失落的歌迷们，有一种身处巨大洪流下的无力感。天气倒是讽刺，雨逐渐消失甚至开始放晴，至少不用打伞了。

演唱会取消归取消，我们的行程还得继续。顺延着海滨长廊继续逛街拍照，海风与水面之间的游船航行在维多利亚港，有种轻松惬意的感觉。远远的可以看见museum+的巨大屏幕和天际100高挑身影。预报说8点有烟花大会，我们在时间差不多的时候选取到一个合适的位置，静静的等待烟花绽放。然而期望越大，失望也挺大，可能是离烟花地点较远的缘故。烟花在感官上非常的小，甚至没有旁边的楼高，反观烟倒是挺大，稀稀拉拉的放了10min就结束了。个人感觉实在是太拉了，无论是本地人还是游客，看到肯定都会失望，宣传的有点用力了。

回程的时候想着吃点东西，到达葵涌附近的富华冰室。一开始我听冰室这个名字，还以为是吃甜品冰淇淋的地方，尝试才知道是类似于香港的那种大排档一样的形式。你可以点各种盖饭面条，外加小零食饮料，算是有香港特色。

DAY2 City Walk 累但挺开心

第二天的主要任务就是逛街。从旺角出发，沿着弥敦道一路向南进发，途径油麻地-佐敦-尖沙咀。路上形形色色的车，形形色色的楼。五彩斑斓的双层巴士，红色鲜艳的小的士。走在香港的街头，路边有繁华的高楼大厦，但同时也有低矮小巷。整体感觉路边乱乱的，但是乱中又透露着秩序，有种矛盾的美感。像是走在一种极度现代与古老的结合体中。
中餐我们找了一家旺角的金华冰厅，在平常的主食基础上，点了菠萝包和西多士。西多士就是炸面包上面加上黄油，不过这一家的西多士有点过于油了，很香但不能够多吃。而且同是港式奶茶，仅仅是冰与热也有很大的区别。
区别于内地的商场，香港地段寸土寸金，有些商场甚至有十几楼高，不过占地面积倒不是很大。从下午走到晚上，一路走到尖沙咀附近，伴随着淅淅沥沥的小雨，再次沿着海滨漫步，星光大道附近有手印长廊，里面有很多明星大导演的手印嵌在其中，还有麦兜可爱的小猪蹄。晚上去一家叫池记的馆子吃的云吞面和艇仔粥，感觉比较正宗，因为云吞面的那个汤够难吃。它艇仔粥的英文够有意思，Congee with pork squid and fish，直观的展示了所有的配料。喝粥是很舒服的，可以消除一定疲惫。这一天走的实在是太累了，从小腿痛到脚后跟。

DAY3 香港海洋公园进发

第三天的行程是香港海洋公园。早晨先到一家小店吃了港式早茶，味道和种类与内地比较相似。点一壶茶，接着就是许许多多的小点心。旁边有很多的老年人，他们看着报纸聊着天，瞬间感觉时间被拉慢了。香港的报纸挺又去，收了一份收藏。

虽然香港也有迪士尼，但是忌惮人流量，还是选取了人数相对较少的海洋公园。票价在美团团购大概 310 元/人。海洋公园像是各地海洋世界与游乐场的结合体。整个公园横跨两座山，坐着小列车上山，然后缆车下山，四周环海，风景一览无余。尽管已经见识过一些海洋世界，但是漆黑一片中突现的海洋场景，巨大的章鱼，凌乱的鱼群，游走的海洋生物，加上场馆偏下坡的地形，我甚至感受到一阵阵迷幻眩晕，切实有种身处海洋世界的感觉。相较于国内的设施，海洋公园感觉有点地方有些岁月的痕迹，褪色和掉漆。我们看了海豚表演，是粤语和汉语双语进行的，表演的过程中穿插了一些保护自然环境和食用本地食品的宣传，要说节目精彩吧，和看过内地的海洋表演比是触不可及，更多感觉他们注重宣传而非表演。公园里面还有一些其他动物栖息，大熊猫，树懒等等。

从海洋公园出来后，我们到达了位于铜锣湾附近的沙嗲王吃晚餐。点了招牌的白咖喱香茅猪扒饭，蟹粉豆腐锅饭和和沙嗲乌冬面，外加一些小食饮料。不得不说白咖喱香茅猪扒和沙嗲还是非常香的，沙嗲有点像潮汕地区的沙茶酱，嘎嘎下饭。饭后又在附近的大商场逛了逛，之后到了尖沙咀的dondondonki 买了日本零食。回程后依旧又是巨累的一天。

DAY4 尖沙咀美食探索然后回程

时间过的飞快，转眼就到了回程的日子。预计下午两点左右从酒店出发去关口，于是进行最后一次美食探索，这里选择了尖沙咀附近的深仔记茶餐厅。虽然叫做茶餐厅，但是和内地形式完全不一样。我们点了叉烧虾仁滑蛋饭，芝士猪扒面，焗咖喱猪扒意面，加上特色的菠萝包和西多士，同样是香到不行。这一家明显比之前吃的冰室更加正宗。之后又去 hashtag 买了蛋挞，不得不说这蛋挞是真的大一口下去满满当当，偏甜。

下午回程的时候下了大雨，我们决定坐出租车从酒店返回落马洲过关口岸。豆大的雨点击打在玻璃上，不得不说老天爷还算给我们面子，虽然国庆假期南方都是雨，但起码我们逛街的时候基本晴朗。不过香港打车是真的贵，大概 27 公里的路程，加上过隧道费，行李费，大概需要将近 300 港币。过关回深圳很顺利，基本没有排队，安检也很顺利。至于回程航班，由于深圳天气有点小插曲，不过好歹还是回来了，也就不再计较了。

香港的一点感想

电子化支付

香港的支付即便是内地过去也不会感觉丝毫不方便，得益于支付宝和微信的普及，你基本可以在任何稍微大一点的地方使用他它们进行支付。再退其次，可以使用 apple 或 google pay 直接开通八达通，作为本地电子化支付的最好选择，无论是地铁公交，还有一些商店，做到了一卡在手，衣食无忧。当然我们还是备了 1000 港币现金的，吃早茶的小馆子没有任何电子支付的手段，手上有点实钱还是安心。

交通趣闻

香港的交通给人感觉一种不太方便，但混乱中又彰显秩序。这是国内交通太方便而造成的心理落差。走在繁华的旺角尖沙咀街头，即便是在小巷没车的情况下，大多数人也不会横穿马路而是从街头巷尾经过。红绿灯不是简单的这边绿那边就红，导致虽然看起来拥挤，但交通也算比较顺畅。居住的附近有个加油站，旁边甚至有单独隔出来供行人走的羊肠小道。香港由于沿用英国式交通规则，过马路先向左看的经验会不适用，不过每条马路口都写了大大的「向左」「向右」的文字进行提示，倒也显得别有风趣。

与之对比，我感觉内地确实很方便。这包含支付，交通，服务等等的舒适程度。但我感觉这种方便是可能建立在一定劳动廉价内卷上的来的，它们背后都是无数人的汗水和辛酸。香港遇见的大部分本地人都挺热情，各个职位上的人，他们的生活好像也不只是被工作所压迫。而且那些开车的，在便利店打工的人年纪有的也都挺高。他们是享受生活？或者为了生活而努力？不会有更年轻的人来替代他们吗？又或者香港新一代的年轻人根本看不上这些时薪与职业。时代在不断变化，我也无法用自己狭隘的目光去妄加推测。可能是由于国内发展过于迅猛，日新月异的变化在我角度看来习以为常。是先进，或者是趋势，还是说怀旧。香港汇丰银行有些网点甚至连个座位都没有，大爷大妈办理业务都是站着排队。人性化吗，肯定不人性。可能是历史遗留，可能是利益度量。无法深究其后的理由，但我充满好奇，以后也还是得多出去走走，多看看别人才能看清自己究竟是什么。

折叠屏Fold5双屏不同桌面方案

Tue, 19 Mar 2024 04:49:00 GMT

我使用三星设备偏多，从S9系列入坑，S9+，S10 5G，Tab S7+，到S22U，耳机手表还用过buds+，buds pro，watch active2和watch classic4，最近还给女票淘了个美丽小废物flip3做热点备用机。实际自折叠屏发售以来我就觊觎已久，特别是fold系列的大折叠，但奈何感觉技术不成熟，加上价格也偏贵，一直没有入手。Fold5作为三星最新屏幕终于能够完整合上的新一代折叠，戳中了我的心窝。由于自己有root的需求，fold系列唯有欧版可以轻易的解锁且能使用相机，在海鲜市场蹲候多时终于入手。天蓝色12+256，屏幕完美，边框有一点点掉漆，不过6300，还要什么自行车，带个凯夫拉壳美滋滋。

三星折叠最与其他品牌折叠不同的点就在于它独特的屏幕比例，折叠情况下23:9的比例，导致它握起来更像是一个遥控器。自带默认的OneUI主屏幕固然可以，在展开内屏的情况下，合理显示布局，加上自带的下面一条任务栏，使用起来非常舒适。但是合起使用外屏时，拥挤的状态不够优雅。Niagara Launcher作为一个第三方启动器，其简洁的滑动字母布局和通知直接呈现提醒非常适合三星狭长的外屏。于是需求产生了，是否可以在外屏使用Niagara主屏幕，而打开内屏后自动切换为有任务栏的OneUI主屏幕呢？

思路拆解

答案显然是可以的，Android是可以选取拿个应用作为默认启动器的。在查阅和综合了相关资料后，结合实际使用情况，这个问题的解决方案可以进一步细化为以下三个部分：

当屏幕合上，为外屏时，切换Niagara为默认主屏幕
当屏幕打开，为内屏时，切换OneUI为默认主屏幕
在外屏正在使用一些app时，如果此时打开为大屏幕内屏，则需要保持这些app为打开状态。即外屏转到内屏时，有些app可以无缝切换（不会返回主屏）

理论上，只要手机厂商允许修改默认启动器，那么在其他牌子折叠屏上也同样可以实现。

无ROOT解决方案

大多情况下，手机是没有root的，这里需要借助Tasker和它的一个插件 AutoTools。Tasker是一个自动化工具，有点类似苹果的快捷指令和三星的日常程序，不过它能够做到的东西更加广泛一些。软件可以试用，tasker建议直接入手，autotools看广告免费用。

tasker使用adb命令去激活read logs的功能，连接adb后，输入以下命令：

adb shell pm grant net.dinglisch.android.taskerm android.permission.READ_LOGS
adb shell am force-stop net.dinglisch.android.taskerm

之后就需要使用tasker创建对应任务和触发条件，这里引用两个其他帖子的方法（本质一样），自行配置，不重复造轮子了。

[Tasker] Auto-switch Launcher for folded/unfolded screen

How to Set Different Launcher for Folded/Unfolded Screen

如果觉得配置起来有点迷糊，这里也有reddit网友给出的tasker一键导入，一共三配置，分别对应思路拆解的三个部分：

Reddit回答 Dual Launcher Fold 5

这里分别解释一下三个配置文件

折叠情况

在自定义设置情况下，执行Folded这个任务。自定义设置为判断条件，edge_panel_width值为401即折叠情况下。Folded任务有以下步骤：

使用AutoTools将主屏幕设置为Niagara。
返回桌面主页。
设置一个变量，名称为FoldStatus，设置此时状态为CLOSED（关闭）。实际上这步可以不需要。后续可以根据这个自定义更多复杂的操作。

判断需要保持打开的APP

在特定app打开的情况下，执行Hold Refresh这个任务；在app关闭后，执行Pause Refresh这个任务。特定app可以根据自己需要选中即可。

其中，Hold Refresh任务定义了一个变量，名称为PauseRefresh，并设定为1。Pause Refresh任务将PauseRefresh这个变量值进行清楚。

因此这个配置文件的逻辑为：在特定选中的app打开时，变量PauseRefresh被设置为1，在app关闭退出时，变量PauseRefresh变为未设置状态。这个主要是为了配合下面一个配置文件做判断。

展开情况

在自定义设置情况下，执行Unfolded这个任务。自定义设置为判断条件，edge_panel_width值为362即展开情况下。UnFolded任务有以下步骤：

使用AutoTools将主屏幕设置为OneUI主屏幕。
判断变量PauseRefresh是否设置，如果设置，表示选中app在前台，不做操作。如果未设置，则返回桌面，启动主屏幕。
将变量FoldStatus，设置此时状态为OPENED（打开）。实际上这步可以不需要。

在导入完三个配置文件后，一定要将默认启动器设置为AutoTools，不然无效。

小瑕疵

因为本质上还是借助AutoTools作为一个中间应用，去启动两个不同的桌面，AutoTools才是默认的桌面，因此有点小瑕疵：比如桌面长按应用无法使用shortcuts；手机重启后展开大屏无法显示状态栏，需要手动把默认桌面先切换回OneUI主屏幕，保证状态栏显示，再修改为AutoTools。不过这些瑕疵无伤大雅，因为99%的时间你不会去调整桌面，也不会经常去重启手机。所以体验还算舒服。

ROOT解决方案

不过既然我都已经root，当然要展现root的优势。主要改进就一点，使用tasker直接调用shell命令，在root的环境下切换默认桌面。这样就可以和AutoTools说拜拜了。

至于切换的命令，探索后发现是这个：

adb shell cmd package set-home-activity com.example.launcher/com.example.launcher.MainActivity

com.example.launcher为启动器的包名，

在tasker中选择将选择Autotools的命令改为运行shell命令，输入语句，例如展开时OneUI启动器：

cmd package set-home-activity com.sec.android.app.launcher/com.sec.android.app.launcher.MainActivity

折叠时Niagara 启动器

cmd package set-home-activity bitpit.launcher/bitpit.launcher.MainActivity

其他更改不变，这样就可以直接切换到默认的启动器，而且小瑕疵问题也解决了。

我图中还借助rotation这个应用，实现折叠小屏强制竖屏，展开大屏强制旋转。另外我发现，用大屏情况下，转到后置摄像头自拍，且用小屏控制时会回到桌面，所以我还设置了一个变量Camera Set，检测如何变为小屏时相机打开了，那么还是再开启相机，实现一个无缝后置摄像头自拍的情况。这种设置很灵活，配合自己的需求修改就好。

Fold5简单使用体验

Fold5到手已经用了快10天了，我用起来还算满意。可能是这种屏幕比例，我更倾向于展开使用屏幕，真的就像在用一个小平板一样，阅读文字和漫画的体验非常舒服。自己也不是追求那么极致的拍照体验，所以从S22U换下来感觉也还好。而且折叠屏最重要的一点，我拍照的时候可以打开后置预览，这样拍人物的时候对方可以在外屏看到呈现效果，调整姿势表情。这简直感动哭了好吧，拍女朋友时候难度直接降低一个等级，增进情侣和睦的好机器呀。

而且8gen2真的出色，尽管Fold5只有4400毫安的电池，当感觉比我8gen1的S22U续航还要好，外出续航焦虑至少是没有了。虽然25w充电，但三星45和25w在充满时间上没太大区别，也感知不强了。

目前时这些，后续如果再有啥体验再补充吧。

自己由于是root玩家，淘一个可以轻易root且不锁相机的欧版也算是花了大功夫。最后我只建议三星你不要不识好歹，把你那针对除了欧版其他版本解锁后相机不能用的规矩给我取消了，让人能好好的玩玩机喽！

一场朋友的婚礼

Sun, 25 Feb 2024 13:34:00 GMT

2024年2月25日，我受邀去参加了高中同学的婚礼。作为这么多年还联络的朋友，外加正好是自己的生日，去参加婚礼时的心情十分开心。虽然说同学邀请了我和我的女朋友，但奈何她正好在项目上出差，只能我一个人带着她的心意去赴宴。

回想起来，这还是我第一次以自己的名义去参加朋友的婚礼，虽然小的时候和老妈一起去参加过婚礼，但那都是以一种儿童的视角。以前印象中参加的婚宴都是晚上进行，而现在很多人都是中午进行婚礼，不知道这是风俗习惯的不同还是时代演化的差异。

宴会厅在合肥滨湖的富茂大酒店，酒店比较红火，今天这个日子有九对新人喜结连理，据说要预定场所都得提前一年预约。酒店门前大大的粉色系花墙，喜庆中透露出温馨。同学的场子在二楼，穿过长长的电梯，婚照便呈现在眼前。比较遗憾的是，我没有与新郎新娘合照，可能是去的时候正好卡点了，和新郎说几句话后他正好要去下面拍，导致没能拍几张俊男靓女合照。

一同参与婚礼的还有几位高中的同学，当然都是经常聚聚的朋友。有时候难免会感叹，这么多年还能保持联络，真的是很难得。人与人之间的关系就是在一点点失去联络之中逐渐疏远的。回想起之前还有几个经常一起上下学的同学，当时觉得关系挺不错的，但是长久没有保持联络，毕业后也就渐渐淡出生活了。

桌台前有高高的花束，摆的比人都高很多。男方女方加起来大概有20多桌。同学们坐一桌，两个同学是新郎的伴郎，穿起礼服来还真是那么回事，俊得很。大家婚礼上又再起相聚，当然还是很开心的，没心没肺的拌拌嘴，唠唠嗑，调调侃，日子仿佛回到了以前。

婚礼上有个小乐队，说是小乐队，主要是就只有主唱，吉他手和一个键盘手。等待的过程中，他们演唱了「你是如此的相信」，「温柔」等歌，还挺好听的。

在12:18的时候，结婚仪式正式开始了，在司仪烘托完气氛后，终于等到新郎和新娘的入场。在庄重的婚礼进行曲中，在众人的欢笑注视中，在漫天气球爆开的包围中，新郎牵着新娘，缓缓地向舞台中间走去。虽然新郎之前给我们吐槽很紧张，但是我发现了，正式流程他也确实是肉眼可见的紧张。在相互宣读完誓词，父母代表发言后，大致的婚礼流程也就结束了。这里实际新郎新娘没有说太多的话，如果要在上面说很多很多的话，那真的是有点心理压力哩。

在祝福完最美好的场景后，饭局开始。安徽人这边似乎对古井贡酒情有独钟，桌子上的白酒是古16，我和一个同学打开来喝了喝，应该是清香型的，喝起来不是那么上头，不容易发昏，虽然我下午回家还是去躺着睡得挺舒服就是。宴会的菜基本上有的都有，螃蟹，虾，甲鱼，石斑鱼，红烧肉等等一大桌子。大家吃吃喝喝相互敬酒和饮料，扯扯淡中时间就过去了。在新郎新娘敬完了所有桌子后，婚礼也基本上到了尾声，拿完喜糖，我们又聊了聊相互祝福后基本上就离场了。

这次去参加婚礼，不仅仅是去给他们送去祝福，也有一部分是想看看未来的自己。自己终将也会经历人生的这么一个过程，结婚是一件重要的事，也是个麻烦事。这些东西的选购，场地预定，相互沟通等等都要花费大量的精力。不过参加朋友的婚礼，也能给我带来一些经验的积累。小时候的我看的更多是热闹，吃的更多是喜糖，现在的我看着红毯上的他们，也会带入自己和女朋友的情境，吃着生活这道酸甜苦辣并存的菜，憧憬着美好的未来。

2023年度总结

Sun, 31 Dec 2023 15:20:00 GMT

2023年已然过去，惯例还是需要总结一下一年的过程。

总体来说今年的状态不算满意，因为生活的主轴并没有步入正轨，从而进入一种混沌的浑浑噩噩状态。我将通过去年的Flag一一对应今年的收获。

职业发展

这是最大的硬伤，自从一月份离职回家后，由于各种原因一直也没有再全职工作。这就产生一种巨大的落差，没有一种稳定收入与投入的事情。虽然自己兼职也接了一些项目，也有一部分的收入，但是那终究不能作为全部。职业技能方面，虽然一直没有拉下，没有太大的退步，但是看待事物难免会眼界落于局限之中，最新最潮的事物肯定弄不明白，也没有那个自制力去弄。

财务状况

目前并没有房子和车子之类负债资产。但是由于没有稳定的收入，投资方面也暂时停下了脚步。从目前自己的投资看来，经过这几年的实验，确实发现市场是一个起起落落的过程。今年的行情尤其不好，投资一片绿油油，不过这个本身就是个过程，顺其自然不断改变吧。投资的理念学习不足，还是需要多读书。

财务的记录方面记账基本坚持了下来，通过小星记账完美的记录了自己的每一笔支出，能明确的看到自己每一步前都花在了哪里。过程是有所收获的，记账是一个长期的过程，未来有了更多的资产，开源节流，才能不断积攒财富。虽然住在家里，但是花费还是不少。设备上主要是增加了一台台式机，用于跑跑代码。其他零零散散软件支出也不少，不过由于有明确的账单，明年重新调整预算还是有所依据的。

信息输出

这一年自己的记录方面基本确定了下来。个人笔记以Obsidian本地为主，Notion表格线上为辅。滴答清单作为轻量级的记录主力使用。之前总是在不同的应用间换来换去，现在越来越趋于简单化。基本形成了一套记录体系，软件如果不出意外的话不会太换了。

输出方面，长篇文章用博客记录，短篇想法用memos表达，除了软件更新，基本上也不想再折腾了。但是落实到今年具体的细节，输出的内容还是太少了，尽管很多时候有很多想法，但是都没有及时的记录进行反思。博客只更新了8篇，一月一篇都没有做到，memos也分享了才大概40个。基本处于想到这东西才去做。这个流程和心理的负担还是需要减少，逼着自己进行输出。因为这些对于自己也是一种回首与反思。

自我实现

这一部分基本没有完成，大部分的精力被奶头乐所消耗，没有充足的动力让我去执行。但是我渐渐也发现自己似乎可以并不用把全部的注意力集中在一件事上也可以大致的完成内容，或许需要从某些细节上验证这个问题。不过注意力分散和好奇心有点消退确实是个问题，需要好好调整。

不过今年还是读了几本书的，也算有点收获。游戏方面，单机游戏玩了王国之类，艾尔登法环，杀戮尖塔等等，联机游戏中，游戏王大师决斗，皇室战争等，都带我领略了电子游戏的魅力。

个人健康

睡觉作息方面，尽管在家里，但是整体的作息还是比较规律的。日常起床，吃饭，基本可以保证正常的日常生活与学习。

身体健康方面，中途有四个月根据b站的课程进行健身，肌肉量有所增长，不过最近天冷了又有所懈怠。但是最近发现明显腰痛，这说明最近明显缺少锻炼，锻炼还是要融入生活中，成为习惯才能坚持下去呀。

心理精神方面，由于直接的压力较小，还是比较愉悦的，而且现在遇到问题好像不会特别着急，仿佛知道急也没有用，如何解决才是硬道理，似乎心智有一些提升。

家庭朋友

在这个方面，由于时间比较充足，和女朋友约会了35次，和朋友相聚了14次，和家人聚餐了19次，外地出行了5次。这点我还是比较满意的，能够有较多的时间陪陪家人，陪陪朋友，看看世界还是很不错的。

自己也快27岁了，这几年也算是非常重要的黄金时间，今年的日子不算好，有很重要的事情没有推进。时间不等人，自己不能懈怠。我每周都会根据清单做一个简单的复盘，所以明白今年在一日一点点过后后的无奈与焦虑。明年真的需要更加努力了。希望明年回顾后能看到更优秀的自己。

迪士尼之旅

Sun, 31 Dec 2023 08:44:00 GMT

女朋友说，迪士尼是世界上最快乐的地方。尽管她已经去过两次上海迪士尼了，但是我们两个一起去倒是未体验过。正好上迪的疯狂动物城园区也正式开幕了，安排好一切事项后，28号开启一趟轰轰烈烈的迪士尼之旅。

用女朋友的话讲，这是她最晚的一次进园。选定的酒店离园区不远，尽管我们6点就已经起床，在洗漱，化妆，吃早饭完毕后不知不觉已经7点半了。打车到迪士尼的地铁口，拿到网上租借的达菲发箍，差不多已经8点多了。虽然八点半才正式开园，但是从此刻开始，一天的奔跑计划就已然拉开序幕！

远远望去，人山人海，为了能够更快一点入园，我被拽着穿过一波又一波的人流。真正排队入园后，大概8点50，外加满头大汗。迪士尼的官方app可以看到地图和各个项目的大致排队入园时间，我们没有犹豫选择最新开的疯狂动物城作为初始目标。经过整整4个大棚的排队后，终于在10点多一点进入了动物城的园区内。整个动物城还原了很多动画中的元素，豹警官，牛局长，充满俏皮可爱。动物城警局，动物城监狱，场景惟妙惟肖。项目「热力追踪」不算刺激，但是绝对精彩，大屏幕的震撼仿佛身临其境，在动画世界中。城中还有很多奇妙的小景点，比如小动物红绿灯，巨大座椅，迷你乐器店等等，还是非常有趣的。

拍拍照出来疯狂动物城园区大概快12点了，正好到了花车巡游的时候，伴随着振奋人心的乐曲，浩浩荡荡的队伍缓缓走来。疯狂动物城，玩具总动员，小飞象，美女与野兽，海底总动员，冰雪奇缘等各路IP都出来亮相，还有他们招牌的各种动画角色，唐老鸭，小熊维尼，玲娜贝儿，达菲等等。这些人物和场景浩浩荡荡的从你眼前经过时，会让你瞬间进入他们营造的世界中，不经意的嘴角上扬。

出来后由于没赶上预约米奇妙游童话书内容，先去排队玩了加勒比海盗，不过内容与剧情不能说是一模一样，只能说是毫不相关。结束差不多快2点了，终于去迪士尼小镇炫完了中午饭。15点左右终于看上了预约的米奇妙游童话书，这个类似于舞台剧，整体场景还是十分迷幻的，虚实结合，配合表演者的演唱和舞蹈共同呈现。一开始我还以为是对嘴型，结果原来真的是在唱，Let it go响起时鸡皮疙瘩起立。整体大概30min，质量上乘。

后续又七零八落的把各个项目都排队玩了一遍。排队的过程是痛苦与漫长的，平均大概排队一个小时，爽一小会儿，创极速光轮，抱抱龙冲天赛车，七个小矮人矿山车。当然还玩了一些休闲小场景，旋转木马，旋转疯蜜罐等等。过程中感觉自己的腿已经不是自己的了，走路不可怕，怕的是站着老半天不动。

在排排等等玩玩后，时间来到了21点，这时最大也是最值得的内容开始了：灯光烟火秀。激昂的歌曲加上变换的场景，灯光投射出斑斓的效果，喷泉交相辉映，甚至在空中映射出虚幻的场景。在不同的IP变换后，巨大的烟火腾空而起，在城堡上方绽放开来，场景震撼且令人着迷。之前我一直以为烟火是重点，看过不少的视频，也看过几次户外烟火表演，然而真正体验过才发现，迪士尼将灯光与烟火结合，加上音乐与喷泉，配合着自己的主题内容一切显得浑然得体。百闻不如一见的明确诠释了。

烟火结束后，这场旅途也接近了尾声，我们去商店逛逛买了达菲后，22点左右离开了园区。一天下来，筋疲力尽，浑身大汗，腰酸脚痛，最后到酒店后有根筋都差点抽了。虽然很累，但是一整天下来也玩到了很多的项目很充实。女朋友说这是世界上最快乐的地方，确实，来到这里你可以抛弃一切的烦恼去享受。我最喜欢的还是花车巡游与灯光烟火，其他自家IP的项目也令人充满喜悦，相较于一些令人肾上腺素飙升的刺激项目，这些在其他地方都无法体会到的独一无二梦幻时刻。另外，与重要的人共同享受这份快乐，创造美好回忆，这也是这趟旅程更重要的事吧。

电子漫画解决方案

Mon, 2 Oct 2023 10:10:00 GMT

20240428更新：
由于tachiyomi由于版权原因消失，有其他换皮应用mihon和他一摸一样。需要手动添加图源。
图源添加参考这个项目extensions
自用图源备份：

官方：
https://raw.githubusercontent.com/keiyoushi/extensions/repo/index.min.json
拷贝漫画：
https://raw.githubusercontent.com/stevenyomi/copymanga/repo/index.min.json

自己很喜欢看漫画，从小学到现在，国漫，日漫，韩漫都有所涉及。但是由于媒介问题，也渐渐从购买实体书籍转换到直接线上观看。有付费，也有白嫖，这里整理一下自己看电子漫画用到的一些软件与资源，以作存档和抛砖引玉。

电子漫画阅读通常有两种媒介，线上观看和本地下载观看。由于漫画都是以章节为单位更新的，所以自己大部分时候都是线上直接追更新。如果遇到那种出了单行本并且自己非常喜欢的漫画，或者一些没有线上资源的小众漫画，才会去寻找资源下载到本地，观看和收藏用。

在线漫画

线上漫画服务我通常使用webtoon和 tachiyomi，并用漫画人作为辅助。

webtoon主要用来看一些韩漫和台湾的漫画。作为官方正版软件，既可以白嫖慢慢追漫画，也可以花钱抢先看。webtoon这个平台的漫画基本是为了迎合手机，所有的漫画都可以一划到底，不会产生较大的割裂，同时彩色漫画也显得更加现代，很多漫画质量都巨高。

tachiyomi作为一个android漫画终端阅读软件，可以通过插件的形式阅读各种网站源的漫画，像是一个聚合器，动漫之家，漫画人，爱米推甚至哔咔这种r18平台都有相关插件。软件本身涉及也符合android规范，没有任何广告。由于是开源软件，也有着其他修改版本，比如tachiyomij2k ，其增加了一些功能比如横屏下的双页布局。我主要用来白嫖阅读日漫和一些国漫，体验较好。

漫画人是自己从初中一直使用的应用，看日漫，主要是用出习惯了，主打一个方便。

腾讯动漫用于看一些国产和日漫，氪点金图方便。

有时候我也会用一下集英社旗下的在线漫画网站MANGA Plus by SHUEISHA看一些生肉，不过看起来还是有点费劲，更多是用它发现漫画。

本地漫画

漫画的格式通常是包含jpg的压缩包，或者是cbz这种带有一些信息的压缩格式，再有一些会制作成epub这种电子书格式的文件。我更多的时候是喜欢将那种线上图源不是很高清的精美漫画（例如烙印勇士）或者非常有意思的短篇（例如蓦然回首）下载下来，没事本地品味一下。喜欢的作品直接网上搜索就可以找到，这里推荐一下Kox.moe，可以用于下载epub格式的漫画。质量和数量都有保障。

本地阅读器

个人经常在android平板和手机，外加windows电脑上进行本地漫画阅读。

在android设备上，我通常使用librera 阅读epub格式的漫画，主要是他可以实现平板上横屏双页外加从右向左的翻页模式阅读，这一点我暂时没有找到替代品。另外我也使用Kuro reader来阅读cbz等专用漫画格式的漫画，主要是ui实在好看，颜值党狂喜。

在windows上，我推荐使用YACReader，既可以进行漫画管理，也可以支持多格式完美的漫画阅读。

当然有时候资源是纯粹的图源，为了较好的进行管理我通常会进行格式转换，这里推荐kcc这个项目，可以将包含漫画的文件夹转化为cbz，epub等格式。省时省力。

如何找到有趣的漫画

大众的热度漫画

每个人的漫画口味不一样，但是大众喜欢的作品通常也不会太差，虽然可能剧情老套，但是很多热门的漫画还是值得一看的。除了在各大漫画app中直接看人气推荐的作品，我还会在kox.moe上用评价从高到低去筛选一些作品，也能发现很多人气虽然不高但精良的佳作。或者在cmoa这类卖书的网站上看看人气作品。

特定类型的漫画

有时候会沉迷于特定类型的漫画，比如我很长一段时候忠实于「智斗」这个标签，为了找到相关类型的漫画，实际最有效的方法是找网上的讨论。贴吧讨论或者知乎回答都是不错的参考，把大家的推荐记录下来，一个个去翻就好了，很多时候都能找到自己想要的。

有趣的新连载

通常你在日常生活中能看到有人讨论漫画，那漫画大概率已经是现象级的作品了。但是如何知道比较小众且高热度的新连载作品呢？这个问题基本就是一个信息的差异。看的多了，就知道哪里会讨论多，会更有趣。

第一种方法是通过平台的投喂。像webtoon经常会推新的漫画，直接看看前两章，感兴趣就直接订阅，很舒服的流程体验。除此之外还可以看看manga plus上的新作，不过他们通常是英语生肉，遇到有趣的作品想看汉化版的还是需要有段时间的，建议精进自己的英语水平。

第二种是推荐。这里可以参考漫画评选网站，例如这本漫画真厉害, 每年评选一次，上榜的都看看还是很有趣的，不过这个评选是日漫。还有就是一些youtuber主，例如孫沁岳, 嘎不拉嘎, 井川一等等，他们会帮我们收集一些漫画资讯，看看他们的视频也会有所收获。

漫画与我

想想看自己已经看漫画有快20年了。小学时的漫画大王，漫画party，初中的动漫水晶，各种日漫单行本，高中知音漫客，加上网络看日漫，大学后转向纯线上，webtoon，腾讯动漫等等。从实体到线上，从国产到国际，阅读漫画已经变成了我的兴趣。晚上睡前基本有空闲时间就打开漫画软件，看看有啥更新了，看个10min，收获的都是快乐。

漫画中能看到各种题材，各种剧情，各种点子。还有漫画家的画风，分镜，叙述逻辑都各不相同。看过史诗级的佳作，也看过烂的不行的大便作。但是各有各的乐趣。作为一种文字与图像结合的艺术创作，漫画真的能够承载很多的东西。它可以展现出文字也描绘不出的场景，又能回避了影像的一些表现阉割。不得不说漫画也养大了我的胃口，以至于看很多热播影视剧时，都会产生这种老套也能吹的想法。漫画着实有趣，我也会一直保留这个兴趣，然后也会多多支持正版为我长久的白嫖买买单。最后也希望我们国家的漫画产业也能像日本韩国那样更加蓬勃的发展。

笔记螺旋上升

Tue, 15 Aug 2023 09:30:17 GMT

好记性不如烂笔头

记笔记这件事，从小到大一直都在做。小学时候，老师家长就教育，好记性不如烂笔头。实际核心是说瞬时记忆想要转化为长久记忆需要不断的反复。学习东西，当时好像明白记住，但是可能明天再看已然不记得细节。通过一些媒介记录下来，时常看看，才能够内化这些知识，更好是做到「温故而知新」。笔记更多的时候是作为一个外脑存在，并辅助将一些内容烙印在真实的大脑中。

在不同的阶段，记笔记的目标和策略也有所不同。高考前的学生时期更多是为了应试考试，把密密麻麻的知识点，老师的精解在纸质的本子上抄下来，用作复习与反思。这个阶段记笔记很纯粹，记录完的一沓沓笔记会感到很满足。

步入大学往后阶段，考试这种东西在生命中占比有所减少。而且这段时间我们也不仅仅是需要记下来一些知识性的问题，生活中的记录，必要性的文章等一些其他的东西同样需要记录。时间多了，看的东西多了，觉得自己之前的眼界太短浅，涉猎东西又都想记下来，于是基于网络化的电子笔记似乎逐渐替代纸质笔记。这个时候的行为会从单纯的「记笔记」转化为一个更为高级的术语：「知识管理」。

我觉得电子化笔记优于纸质笔记的核心一点就是易于整理与搜寻。电子媒介借助特定的格式（如markdown），或是独有的结构（单位块），可以轻松的将大部分的内容进行调整和编辑。依托于搜索功能，也能够将之前记录的内容迅速查找调用，极大的提高使用效率。

器与术

在我个人探索的过程中，接触到了很多关于如何记好笔记的术和方便记笔记的器。术的方面多种多样，每种都有自己的特色与精进。从用于整理文件夹的图书馆分类法，到打标签多维度检索，再到突出双链以块为单位的卡片盒笔记法。新的方法一直在涌现，这其中有的是互补，有的是方法的精炼。

然而在器方面，才是更加的百花齐放。小到各厂家自带的备忘录，到专业的如印象笔记，为知笔记，Notion，Roam Research，Obsidian等等。我有很长一段时间在不同的软件之间来回折腾，似乎研究用什么做笔记比做笔记本身更有意思，工具越用越多，内容记了屁点。颇有大部分独立博客的文章都是只有「如何搭建一个独立博客」的意味。

我的笔记折腾经历

要问如何记电子笔记，选择一个合适的应用很重要的。数据如何保存，格式是否友好，更新频率如何，开发团队情况，这些都需要考虑在内。

我最开始使用印象笔记，一开始还是很优秀的。它能存放任何的东西，图片，视频，音频，文件等等，加上强大的剪藏功能，真的是个完美的笔记软件。甚至开始还有那种得到的课程直接通过印象笔记进行分享的黑产，用起来很舒服。但是后面慢慢加了很多冗余的东西，随之而来的是越来越多的vip，svip，ssvip。在看有优惠一口气续了三年的会员，它还推出10年会员后，我终于怕了。害怕它倒闭我所有东西都付之一炬，我决定快跑，同时也看到一个新的应用向我招手，那就是Notion。

Notion作为一个可以All in one的应用，在最开始推出的时候就展现出了极大的潜力，所有文章都可以以块为最小单位随意任意链接，其强大的表格功能，过滤功能，再加上用户们分享的各种模板，用起来真的觉得是有无限的可能性。我个人尤其喜欢它的表格统计功能，做各种汇总的时候真的很方便。要说缺点，就是功能有点太多比较复杂，同时需要依赖科学的网络环境。

除此之外我还有使用Obsidian，目前逐渐将一些重要的笔记使用这个软件进行记录。经历了印象笔记那种体验，笔记能掌控在自己手里并进行分享是我一个很看重的点。作为一个本地应用，能够把数据存放在本地，可以使用自己搭建的云服务进行同步。软件社区维护积极，借助插件，应用可以使用的很简单，也可以很折腾，适合各种需求的人。要说麻烦的地方，就是由于基本格式是markdown，图片之类的保存不会像其他软件那么集成，不过借助图床插件也还算方便。

什么才是值得记录的

上周想起我很久之前买的印象笔记会员要到期了，于是打算把里面有用的笔记迁移一下。这一整理，发现有用的东西寥寥无几，这也让我重新思考了一遍什么东西才是值得记录的。从前的自己沉迷稍后读，配合印象笔记的剪藏功能，有些有价值的文章就直接整篇剪贴进来，但是读倒是没读多少。再以现在的眼光看那些文章，它们中很多已经没有太大价值了。笔记这种东西，不仅需要有摘录，更要有自己的思考。剪藏这个过程有时候很必要，但不一定要在笔记中呈现。就我而言，真正需要记录的东西如下：

学习东西自己写的知识点的笔记

这种类型的最终目的是内化。这也是最原始的形式，类似于从小到大纸质的笔记。但是这并不是大段的复制，那样没有价值的。需要有自己的归纳总结，可以记的很简单，写好引用，以便查阅的时候可以溯源。

突然迸发思考而碎片化的想法

这种类型的最终目的是输出。人是有表达欲的，写博客的目的也是如此，碎片化的想法可能很短，但也很珍贵，全部作为笔记收集起来也是一笔财富。在一个合适的时间段总结整理一下，发个大文章也好，全部发到吐槽里也罢，都是一种不错的选择。

记录的一些流水账或统计

这种主要就是为了记录，信息统计，或者经验记录，还有总结思考之类的。比如每周周报，一些表格信息，这些也都可以放在其中用作查用。

至于工具上，我觉得也不用都归一于同一应用，写自己笔记我用Obsidian，它比较好管理；碎片化想法可能用滴答清单顺便就记了，到时候再整理；统计使用Notion的表格更方便，每种软件取其长处用就好了。

总体感觉自己对于记笔记这事是一个螺旋上升的过程，一个时间段感觉自己悟了，但后面又觉得之前做的不对，但貌似在否定之否定中还是处于进步的过程中。术有很多，但每个人适合的都不一样，这个过程与平衡只能慢慢探索了。

八三夭 live house

Mon, 22 May 2023 04:25:54 GMT

提起听演唱会，上次一次的记忆还是大学时代五月天的现场版，大体育馆内的千人合唱，想起来很是享受。然而会与近些年兴起的live house形式的演出自己一直没有参加过，正好八三夭来合肥，女朋友又从闲鱼上购入了两张票，正好去体验一下。

live house（ライブハウス）诞生于上世纪的日本，作为一种于体育馆截然不同的形式，live house为那些名气不是特别大的音乐人提供了一个很好的舞台，三五百人的容纳提供了更好的氛围与形式。这次去的奕空间正好位于合肥奥体中心旁边，是一个篮球场改造的，场馆内部是一整个空间，大概容纳了五百人左右。舞台空间上，音响质量还可以，正前方，左前方和右前方各有一个大屏幕，基本上就是体育馆演唱会的微缩版。

八三夭是台湾的乐队，和五月天一样都是来自相信音乐旗下的艺人。他们最广为人知的歌曲应该是2019年电视剧《想见你》的主题曲「想见你想见你想见你」

但实际我大概在14年左右就关系喜欢了这个乐队，他们当时比现在还是差点，不过也是把他们的专辑都听了一遍，最后的831，东区东区，我怎么哭了等等直到现在都是他们主打的歌曲。然而不知道为啥，可能是听的音乐太多了，他们渐渐消失在了我的音乐列表，后续只有一些现象级的歌曲听过（如想见你想见你想见你，不摇滚，一事无成的伟大等等）。因此去听他们的live house，也有一些现充的成分，因为很多新歌都只听过一两次，远远达不到之前单专辑不断循环的地步。

演出8点正式开始，不过7点半有暖场嘉宾，魏嘉莹，小姐姐之前没听过，不过唱的还是挺好的，感觉现场还是蛮稳的，多是那种放松抒情的歌。

八点整，重点来了，八三夭来了，上来先是几首较燃的歌曲引爆全场的气氛。个人觉得八三夭的很多哥都适合与这种演唱会的形式，强劲的节奏和鼓点，就算没听过这首歌也能跟着奏乐跟着摇摆的那种感觉。

感觉主场阿噗颜值忽高忽低哈哈🤣

调动观众气氛是一件非常重要的事情，八三夭这点做的很好，身为一个乐队，不断的重复介绍自己的团员，每个人都进行富有特点的talking，给乐迷和路人都会留下很深的印象，不会觉得只有主唱在唱，其他人不过是打工的可有可无的情况。

另外他们将一些歌曲进行简化，让观众跟着旋律唱一些简单的句子，进而提高互动率，让我这种对新歌不太熟悉的现充也有很好的参与感😘。

还有和体育馆演唱会一样的翻唱Encore，老传统了。说是最后一首歌，然后唱完下去了，舞台灯也熄灭了，乐迷们大喊「八三夭，八三夭」，在声声呼唤中再回来继续奏乐继续舞~

最终持续到10点多结束，整体的现场还是很嗨的，能明显的感受到，如果想跳，还是能够跳起来的，就是小腿有点酸痛罢了。

个人觉得，这场live house还是很值的。演唱会这种东西现场和屏幕前完全是两种概念，那种快乐的氛围简直是天差地别。生活中能够蹦蹦跳跳的机会不多，能够和有着一起喜好的人嗨的机会不多，疫情的封闭让大家太压抑了，唱跳完感觉很爽，全身都是汗。生活本身平淡，热烈的事情还是需要去寻找。

OpenCV高级操作

Mon, 10 Apr 2023 04:31:00 GMT

阈值处理

阈值处理有很多种，有三种形式：

手动提供参数来设定合适的阈值分割图像。需要控制照明条件下工作得非常好，可以确保图像的前景和背景之间的高对比度。
如OTSU阈值之类的方法，这些方法试图更动态地自动计算最佳阈值。
自适应阈值，它不是试图用一个单一的值全局地阈值一个图像，而是把图像分解成更小的部分，然后分别地和单独地对每个部分进行阈值。

手动阈值 Basic thresholding

需要手动确定阈值T

# apply basic thresholding -- the first parameter is the image
# we want to threshold, the second value is is our threshold
# check; if a pixel value is greater than our threshold (in this
# case, 200), we set it to be *black, otherwise it is *white*
(T, threshInv) = cv2.threshold(blurred, 200, 255,
	cv2.THRESH_BINARY_INV)
cv2.imshow("Threshold Binary Inverse", threshInv)

cv2.threshold 第一个参数为需要处理的图像，第二个为阈值T，第三个为高于阈值后需要变化为的数值（通常为255，表示变为黑色），第四个为阈值处理方法。
输出结果第一个T表示阈值，第二个表示阈值后的图像。

自动化阈值 OTSU

OTUS可以帮助我们自动设置阈值。Otsu的方法假设我们的图像像素强度的灰度直方图是双模态的，这仅仅意味着直方图是两个峰。[[opencv直方图对比|直方图详解]]

例如如下图像，第一个尖峰对应于图像的统一背景颜色，而第二个峰值对应于药丸区域本身。

(T, threshInv) = cv2.threshold(blurred, 0, 255,
	cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)

使用OTSU第二个参数设置为了0，因为它会自动帮助我们计算阈值。

import argparse  
import cv2  
ap = argparse.ArgumentParser()  
ap.add_argument("-i", "--image", type=str, required=True,  
   help="path to input image")  
args = vars(ap.parse_args())  
  
# load the image and display it  
image = cv2.imread(args["image"])  
cv2.imshow("Image", image)  
# convert the image to grayscale and blur it slightly  
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  
blurred = cv2.GaussianBlur(gray, (7, 7), 0)  
  
# apply Otsu's automatic thresholding which automatically determines  
# the best threshold value  
(T, threshInv) = cv2.threshold(blurred, 0, 255,  
   cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)  
cv2.imshow("Threshold", threshInv)  
print("[INFO] otsu's thresholding value: {}".format(T))  
# visualize only the masked regions in the image  
masked = cv2.bitwise_and(image, image, mask=threshInv)  
cv2.imshow("Output", masked)  
cv2.waitKey(0)

注意一下cv2.threshold 中的阈值方法参数：

cv2.THRESH_BINARY_INV 二值化后再反转
cv2.THRESH_BINARY 正常二值化

参考 OpenCV Thresholding ( cv2.threshold ) - PyImageSearch

自适应阈值 adaptive thresholding

对于一些复杂的图像，全局只有一个阈值分割效果可能会不好，因此使用自适应阈值。而且可以避免训练专用Mask R-CNN或U-Net分割网络的耗时和计算昂贵的过程。

具体思想是在小块的领域确定阈值，选取区域大小是个需要调整的参数。区域阈值计算方法可以选择算术平均值或高斯平均值，算数平均更加常用。

thresh = cv2.adaptiveThreshold(blurred, 255,
	cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 21, 10)

输入参数第一个为目标图像；第二个为输入阈值；第三个为自适应阈值方法，可选cv2.ADAPTIVE_THRESH_MEAN_C 或 cv2.ADAPTIVE_THRESH_GAUSSIAN_C ；第四个如同手动阈值方法；第五个是领域大小，这里表示21×21；最后一个为微调常数值C，通过加减C来进行调整阈值。

image = cv2.imread('test.png')
cv2.imshow("Image", image)
# convert the image to grayscale and blur it slightly
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (7, 7), 0)

# instead of manually specifying the threshold value, we can use
# adaptive thresholding to examine neighborhoods of pixels and
# adaptively threshold each neighborhood
thresh = cv2.adaptiveThreshold(blurred, 255,
	cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 21, 4)
cv2.imshow("Mean Adaptive Thresholding", thresh)
cv2.waitKey(0)

参考 Adaptive Thresholding with OpenCV ( cv2.adaptiveThreshold )

图像平滑和模糊

平滑和模糊是计算机视觉和图像处理中最常见的预处理步骤之一。在应用边缘检测或阈值分割等技术之前，通过平滑图像，能够减少高频内容的数量，如噪声和边缘(即图像的细节)。

平均模糊 cv2.blur

取中心像素周围的像素区域，将所有这些像素平均在一起，并用平均值替换中心像素。通常使用 M×N (M N为奇数)的内核进行平均。随着内核大小的增加，图像模糊的数量也会增加。

kernelSizes = [(3, 3), (9, 9), (15, 15)]
# loop over the kernel sizes
for (kX, kY) in kernelSizes:
	# apply an "average" blur to the image using the current kernel
	# size
	blurred = cv2.blur(image, (kX, kY))
	cv2.imshow("Average ({}, {})".format(kX, kY), blurred)
	cv2.waitKey(0)

高斯模糊 cv2.GaussianBlur

高斯模糊类似于平均模糊，但不是简单的平均值，而是加权平均值，其中更接近中心像素的邻域像素对平均值贡献更多的权重。借助M×N 的内核(M N为奇数)，基于这种加权，将能够保留图像中更多的边缘。

x和y方向上的高斯函数如下：

G(x,y)= \frac{1}{2 \pi \sigma}e^{- \frac{x^{2}+y^{2}}{2 \sigma ^{2}}}

当内核的大小增加时，应用于输出图像的模糊量也会增加。

kernelSizes = [(3, 3), (9, 9), (15, 15)]
# loop over the kernel sizes again
for (kX, kY) in kernelSizes:
	# apply a "Gaussian" blur to the image
	blurred = cv2.GaussianBlur(image, (kX, kY), 0)
	cv2.imshow("Gaussian ({}, {})".format(kX, kY), blurred)
	cv2.waitKey(0)

最后一个参数为高斯分布的标准差。通过将这个值设置为0，我们指示OpenCV根据内核大小自动计算。更多细节可以参考 OpenCV documentation

中值模糊 cv2.medianBlur

中值模糊方法是去除椒盐噪声最有效的方法。该方法的内核大小必须是正方形。并且用邻域的中值代替中心像素。

中值模糊在从图像中去除椒盐风格噪声时更有效的原因是每个中心像素总是被图像中存在的像素强度所取代。由于中位数对异常值具有稳健性，与平均值等其他统计方法相比，椒盐噪声对中位数的影响较小。

kernelSizes = [(3, 3), (9, 9), (15, 15)]
# loop over the kernel sizes a final time
for k in (3, 9, 15):
	# apply a "median" blur to the image
	blurred = cv2.medianBlur(image, k)
	cv2.imshow("Median {}".format(k), blurred)
	cv2.waitKey(0)

双边模糊 cv2.bilateralFilter

上面几种模糊方法往往会失去图像的边缘，为了在保持边缘的同时减少噪声，可以使用双边模糊（利用两个高斯分布）。但是它的速度会慢很多。

blurred = cv2.bilateralFilter(image, diameter, sigmaColor, sigmaSpace)

第一个参数为需要模糊的图像；第二个参数为像素邻域的直径。直径越大，模糊计算中包含的像素就越多；第三个参数是颜色标准偏差，更大的值意味着在计算模糊时将考虑附近更多的颜色。第四个参数为坐标空间中的sigma值。它的值越大，说明有越多的点能够参与到滤波计算中来。

参考 OpenCV Smoothing and Blurring - PyImageSearch

形态学操作

形态学运算是应用于二值或灰度图像的简单变换。形态学操作探测带有结构元素(structuring elements)的图像。这个结构元素定义了每个像素周围要检查的邻域。根据给定的操作和结构元素的大小，我们可以调整输出图像。

有时候很多东西根本不配用上特别高级的算法，例如机器学习，深度学习。

结构元素在opencv中用cv2.getStructuringElement定义，如下与定义4邻域和8邻域的一个例子

侵蚀 Erosion

图像中物体边界附近的像素将被丢弃侵蚀掉。

侵蚀通过定义结构元素，然后在输入图像上从左到右、从上到下滑动这个结构元素。只有当结构元素中的所有像素都是> 0时，输入图像中的前景像素才会被保留。否则，像素被设置为0(即背景)。

使用 cv2.erode

# apply a series of erosions
for i in range(0, 3):
	eroded = cv2.erode(gray, None, iterations=i + 1)
	cv2.imshow("Eroded {} times".format(i + 1), eroded)
	cv2.waitKey(0)

第一个参数为需要侵蚀的图像；第二个为侵蚀的结构元素，设为None表示3×3的8领域结构；第三个为膨胀迭代次数。

膨胀 dilation

膨胀可以增加前景对象的大小，尤其适用于将图像的破碎部分连接在一起。通过定义结构元素，若任意一个像素为> 0，则结构元素的中心像素p将被设置为白色。

使用 cv2.dilate

# apply a series of dilations
for i in range(0, 3):
	dilated = cv2.dilate(gray.copy(), None, iterations=i + 1)
	cv2.imshow("Dilated {} times".format(i + 1), dilated)
	cv2.waitKey(0)

参数类似侵蚀，基本同理

开操作 Opening

开操作是侵蚀之后的膨胀。该操作可以从图像中删除小斑点:首先应用侵蚀来删除小斑点，然后应用膨胀来重新增长原始对象的大小。

kernelSizes = [(3, 3), (5, 5), (7, 7)]
# loop over the kernels sizes
for kernelSize in kernelSizes:
	# construct a rectangular kernel from the current size and then
	# apply an "opening" operation
	kernel = cv2.getStructuringElement(cv2.MORPH_RECT, kernelSize)
	opening = cv2.morphologyEx(gray, cv2.MORPH_OPEN, kernel)
	cv2.imshow("Opening: ({}, {})".format(
		kernelSize[0], kernelSize[1]), opening)
	cv2.waitKey(0)

cv2.getStructuringElement用来定义一个结构元素。第一个参数结构元素类型：cv2.MORPH_RECT 表示正方形结构（8邻域），cv2.MORPH_CROSS 表示十字形结构（4邻域），cv2.MORPH_ELLIPSE 表示圆形结构。第二个参数表示大小。

这里开操作使用 cv2.morphologyEx 函数，不过实际上它能够传递任何想要的形态操作。这里操作方式选择cv2.MORPH_OPEN 表示开操作。

闭操作 Closing

闭操作是膨胀之后的侵蚀。它可以将物体内部的孔或将组件连接在一起。

kernelSizes = [(3, 3), (5, 5), (7, 7)]
for kernelSize in kernelSizes:
	# construct a rectangular kernel form the current size, but this
	# time apply a "closing" operation
	kernel = cv2.getStructuringElement(cv2.MORPH_RECT, kernelSize)
	closing = cv2.morphologyEx(gray, cv2.MORPH_CLOSE, kernel)
	cv2.imshow("Closing: ({}, {})".format(
		kernelSize[0], kernelSize[1]), closing)
	cv2.waitKey(0)

与开操作类似，不过cv2.morphologyEx 函数中方法选择 cv2.MORPH_CLOSE

形态学梯度 Morphological gradient

形态学梯度是膨胀和侵蚀之间的差异。它对于确定图像的特定对象的轮廓很有用

kernelSizes = [(3, 3), (5, 5), (7, 7)]
for kernelSize in kernelSizes:
	# construct a rectangular kernel and apply a "morphological
	# gradient" operation to the image
	kernel = cv2.getStructuringElement(cv2.MORPH_RECT, kernelSize)
	gradient = cv2.morphologyEx(gray, cv2.MORPH_GRADIENT, kernel)
	cv2.imshow("Gradient: ({}, {})".format(
		kernelSize[0], kernelSize[1]), gradient)
	cv2.waitKey(0)

cv2.morphologyEx 函数中方法选择 cv2.MORPH_GRADIENT

顶帽操作（Top hat/white hat）和黑帽操作（black hat）

top hat用于在深色背景上显示图像的明亮区域。

image = cv2.imread(args["image"])
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# construct a rectangular kernel (13x5) and apply a blackhat
# operation which enables us to find dark regions on a light
# background
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (13, 5))
blackhat = cv2.morphologyEx(gray, cv2.MORPH_BLACKHAT, rectKernel)

# similarly, a tophat (also called a "whitehat") operation will
# enable us to find light regions on a dark background
tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)

# show the output images
cv2.imshow("Original", image)
cv2.imshow("Blackhat", blackhat)
cv2.imshow("Tophat", tophat)
cv2.waitKey(0)

分别使用 cv2.MORPH_BLACKHAT 和 cv2.MORPH_TOPHAT 去进行操作

参考 OpenCV Morphological Operations

颜色空间

主要基于 cv2.cvtColor 函数

照明条件的重要性

照明条件对于计算机视觉处理流程有着重要的影响。光的质量是图像进入算法前就应该积极考虑的，它可能是最重要的因素。

高对比度 High contrast
尽量确保环境的背景和前景之间有很高的对比度，这将使编写代码更容易准确地理解背景和前景。
可推广的 Generalizable
照明条件应该足够一致，以至于它们从一个物体到另一个对象都可以很好地工作。
稳健性 Stable
拥有稳定、一致和可重复的照明条件是计算机视觉应用开发重要因素。

RGB color space

由RGB三个通道组成，每个通道范围为[0,255]。RGB颜色空间是加色空间的一个例子:每种颜色加的越多，像素就变得越亮，越接近白色。需要将三个通道都加起来才能表示一种颜色。

HSV color space

HSV颜色空间会改变RGB的颜色空间，将其重塑为圆柱体而不是立方体。在RGB部分中看到的，颜色的白色或明度是每个红色、绿色和蓝色组件的相加组合。但现在在HSV颜色空间中，亮度被赋予了自己的独立维度。

Hue：检查哪种“纯”颜色。例如，颜色“红色”的所有阴影和色调都具有相同的色调。
Saturation：颜色是多么“白色”。完全饱和的颜色将是“纯”，如“纯红色”。零饱和的颜色将是纯白色。
value：控制颜色的明度。0将表示纯黑色，而增加将产生较浅的颜色

不同的计算机视觉库将使用不同的范围来表示每个色相、饱和度和值组件。
在OpenCV中，图像表示为8位无符号整数数组。因此，Hue值被定义为范围[0,179] (总共有180个可能的值，因为[0,359]共360对于8位无符号数组是不可能的)，Hue实际上是HSV颜色圆柱上的度数。Saturation和value范围都在[0,255]。

转换方式使用cv2.COLOR_BGR2HSV

hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

Value组件本质上是一个灰度图像，这是因为Value控制了颜色的实际明度，而Hue和Saturation定义了实际的颜色和阴影。HSV颜色空间在计算机视觉应用中被大量使用，特别是当我们对跟踪图像中某些物体的颜色感兴趣时。使用HSV定义一个有效的颜色范围比使用RGB要容易得多。

L* a* b* color space

该方法目标是模仿人类观察和解释颜色的方法。L* a* b* 颜色空间中任意两种颜色之间的欧几里得距离具有实际的感知意义。L* a* b* 颜色空间是一个3轴系统

L-channel: 像素的亮度。这个值在垂直轴上上下变化，从白色到黑色，轴的中心是中性灰色。
a-channel: 源于L通道的中心，在光谱的一端定义纯绿色，在另一端定义纯红色。
b-channel：源于l通道的中心，但垂直于a通道。b通道在一个光谱上定义纯蓝色，在另一个光谱上定义纯黄色。

L* a* b* 颜色空间不像HSV和RGB颜色空间那么直观，但它在计算机视觉中被大量使用。这是因为颜色之间的距离具有实际的感知意义，使我们能够克服各种光照条件问题。它还可以作为一个强大的彩色图像描述符。

转换方式使用cv2.COLOR_BGR2LAB

lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)

L* 通道，用于显示给定像素的亮度。然后，a* 和b* 决定像素的阴影和颜色。

灰度 Grayscale

转换方式使用cv2.COLOR_BGR2GRAY

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

转化为单一通道像素范围在[0,255]的图像。转化公式如下

Y=0.299 \times R+0.587 \times G+0.114 \times B

不平均主要是由于我们视觉感知RGB三种颜色敏感度不同。

参考 OpenCV Color Spaces ( cv2.cvtColor )

图像梯度

图像梯度的作用

使用梯度检测图像中的边缘，在图像中找到对象的轮廓，阴影，边缘等等
用作通过特征提取来量化图像的输入。例如定向梯度直方图（Histogram of Oriented Gradients）和 SIFT
用于构建显着图（saliency maps），突出显示图像的主题

通常检测到图像的边缘叫做edge map

关于图像梯度手动计算的方法参考这里

Sobel and Scharr kernels

Sobel使用了两个核，一个用于检测水平方向的变化，另一个用于检测垂直方向的变化

G _ { x } = \left[ \begin{array} { l l l } { - 1 } & { 0 } & { + 1 } \\ { - 2 } & { 0 } & { + 2 } \\ { - 1 } & { 0 } & { + 1 } \end{array} \right]\ and\ G _ { y } = \left[ \begin{array} { l l l } { - 1 } & { - 2 } & { - 1 } \\ { 0 } & { 0 } & { 0 } \\ { + 1 } & { + 2 } & { + 1 } \end{array} \right]

Scharr类似，不过核不太一样，效果会更好一些。

G _ { x } = \left[ \begin{array} { l l l } { - 3 } & { 0 } & { + 3 } \\ { - 10 } & { 0 } & { + 10 } \\ { - 3 } & { 0 } & { + 3 } \end{array} \right]\ and\ G _ { y } = \left[ \begin{array} { l l l } { - 3 } & { - 10 } & { - 3 } \\ { 0 } & { 0 } & { 0 } \\ { + 3 } & { + 10 } & { + 3 } \end{array} \right]

代码使用

import argparse
import cv2
# construct the argument parser and parse the arguments
# scharr 参数为0表示使用sobel内核，>0表示使用scharr内核
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", type=str, required=True,
	help="path to input image")
ap.add_argument("-s", "--scharr", type=int, default=0,
	help="path to input image")
args = vars(ap.parse_args())

image = cv2.imread(args["image"])
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("Gray", gray)

# set the kernel size, depending on whether we are using the Sobel
# operator of the Scharr operator, then compute the gradients along
# the x and y axis, respectively
ksize = -1 if args["scharr"] > 0 else 3
gX = cv2.Sobel(gray, ddepth=cv2.CV_32F, dx=1, dy=0, ksize=ksize)
gY = cv2.Sobel(gray, ddepth=cv2.CV_32F, dx=0, dy=1, ksize=ksize)

# the gradient magnitude images are now of the floating point data
# type, so we need to take care to convert them back a to unsigned
# 8-bit integer representation so other OpenCV functions can operate
# on them and visualize them
gX = cv2.convertScaleAbs(gX)
gY = cv2.convertScaleAbs(gY)

# combine the gradient representations into a single image
combined = cv2.addWeighted(gX, 0.5, gY, 0.5, 0)
# show our output images
cv2.imshow("Sobel/Scharr X", gX)
cv2.imshow("Sobel/Scharr Y", gY)
cv2.imshow("Sobel/Scharr Combined", combined)
cv2.waitKey(0)

参考 Image Gradients with OpenCV (Sobel and Scharr)

边缘检测

通常会使用Canny边缘检测器，opencv中使用cv2.Canny函数

在边缘检测过程中，梯度幅值对噪声极其敏感。Canny检测中，边被定义为像素强度的不连续，或者更简单地说，像素值的急剧差异和变化。

几种边缘示例

Canny边缘检测步骤

噪声去除：使用[[Opencv高级处理#高斯模糊 cv2.GaussianBlur|高斯模糊]]等去除图片噪声，做平滑处理
计算图像梯度：对平滑后的图像使用[[Opencv高级处理#Sobel and Scharr kernels|Sobel算子]]计算水平方向和竖直方向的一阶导数(Gx 和Gy)。根据得到的这两幅梯度，找到边界梯度和方向
非极大值抑制（ Non-maxima suppression）：在获得梯度的方向和大小之后，对整幅图像进行扫描（通常是3×3），去除那些非边界上的点。对每一个像素进行检查，看这个点的梯度是不是周围具有相同梯度方向的点中最大的（如果中心像素的大小大于与之比较的两个像素，则保留，否则丢弃）
滞后阈值（ Hysteresis thresholding）：确定真正的边界，设置两个阈值: TminVal 和TmaxVal。当图像的灰度梯度高于TmaxVal时被认为是真的边界，低于TminVal的边界会被抛弃

调用方法，需要设定上下界的阈值

image = cv2.Canny(blurred, TminVal, TmaxVal)

自动canny代码

实际上这个auto_canny代码已经集成在了imutils中，可以直接调用

import argparse  
import cv2  
import numpy as np  
  
def auto_canny(image, sigma=0.33):  
    v = np.median(image)  
    # apply automatic Canny edge detection using the computed median  
    lower = int(max(0, (1.0 - sigma) * v))  
    upper = int(min(255, (1.0 + sigma) * v))  
    edged = cv2.Canny(image, lower, upper)  
    return edged  
  
ap = argparse.ArgumentParser()  
ap.add_argument("-i", "--image", required=True, help="Path to the image")  
args = vars(ap.parse_args())  
  
image = cv2.imread(args["image"])  
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  
blurred = cv2.GaussianBlur(gray, (3, 3), 0)  
  
wide = cv2.Canny(blurred, 10, 200)  
tight = cv2.Canny(blurred, 225, 250)  
auto = auto_canny(blurred)  
  
cv2.imshow("Original", image)  
cv2.imshow("Wide", wide)  
cv2.imshow("Tight", tight)  
cv2.imshow("Auto", auto)  
cv2.waitKey(0)

参考 OpenCV Edge Detection ( cv2.Canny )

轮廓近似

OpenCV Contour Approximation，称为Ramer–Douglas–Peucker 算法
目的是通过减少给定阈值的折线顶点来简化折线。通俗地说，我们取一条曲线，减少它的顶点数量，同时保留它的大部分形状

主要使用cv2.findContours函数寻找所有的轮廓，再使用cv2.approxPolyDP对轮廓进行近似。

import numpy as np  
import argparse  
import imutils  
import cv2  
# construct the argument parser and parse the arguments  
ap = argparse.ArgumentParser()  
ap.add_argument("-i", "--image", type=str, default="shape.png",  
   help="path to input image")  
args = vars(ap.parse_args())  
  
# load the image and display it  
image = cv2.imread(args["image"])  
cv2.imshow("Image", image)  
  
# convert the image to grayscale and threshold it  
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  
thresh = cv2.threshold(gray, 200, 255,  
   cv2.THRESH_BINARY_INV)[1]  
cv2.imshow("Thresh", thresh)  
  
# find the largest contour in the threshold image  
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,  
   cv2.CHAIN_APPROX_SIMPLE)  
cnts = imutils.grab_contours(cnts)  
c = max(cnts, key=cv2.contourArea)  
  
# draw the shape of the contour on the output image, compute the  
# bounding box, and display the number of points in the contour  
output = image.copy()  
cv2.drawContours(output, [c], -1, (0, 255, 0), 3)  
(x, y, w, h) = cv2.boundingRect(c)  
text = "original, num_pts={}".format(len(c))  
cv2.putText(output, text, (x, y - 15), cv2.FONT_HERSHEY_SIMPLEX,  
   0.9, (0, 255, 0), 2)  
  
# show the original contour image  
print("[INFO] {}".format(text))  
cv2.imshow("Original Contour", output)  
cv2.waitKey(0)  
  
# to demonstrate the impact of contour approximation, let's loop  
# over a number of epsilon sizes  
for eps in np.linspace(0.001, 0.05, 10):  
   # approximate the contour  
   peri = cv2.arcLength(c, True) # 计算周长  
   approx = cv2.approxPolyDP(c, eps * peri, True)  
   # draw the approximated contour on the image  
   output = image.copy()  
   cv2.drawContours(output, [approx], -1, (0, 255, 0), 3)  
   text = "eps={:.4f}, num_pts={}".format(eps, len(approx))  
   cv2.putText(output, text, (x, y - 15), cv2.FONT_HERSHEY_SIMPLEX,  
      0.9, (0, 255, 0), 2)  
   # show the approximated contour image  
   print("[INFO] {}".format(text))  
   cv2.imshow("Approximated Contour", output)  
   cv2.waitKey(0)

通过改变eps的值，一步步的近似轮廓边缘。

参考 # OpenCV Contour Approximation

OpenCV基本操作

Mon, 10 Apr 2023 04:30:00 GMT

#opencv

最近在复习和学习OpenCV这个库，罗列一下知识点供以后整理查阅

坐标关系

OpenCV坐标为x向右为正，y向下为负。在代码中表示一个坐标先y后x 例如下面要选择x,y=(90,40)这个点

代码表示如下：

# pixel coordinates
x = 90
y = 40
 
pixel_flame_gray16 = gray16_image [y, x]

另外opencv读取的RGB图像的顺序是B,G,R

# images are simply NumPy arrays -- with the origin (0, 0) located at
# the top-left of the image
(b, g, r) = image[0, 0]
print("Pixel at (0, 0) - Red: {}, Green: {}, Blue: {}".format(r, g, b))

读取文件

使用cv2.imread 前3个维度分别为Height，width和channels

import argparse
import cv2
# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True,
	help="path to input image")
args = vars(ap.parse_args())

# load the image from disk via "cv2.imread" and then grab the spatial
# dimensions, including width, height, and number of channels
image = cv2.imread(args["image"])
(h, w, c) = image.shape[:3]
# display the image width, height, and number of channels to our
# terminal
print("width: {} pixels".format(w))
print("height: {}  pixels".format(h))
print("channels: {}".format(c))

# show the image and wait for a keypress
cv2.imshow("Image", image)
cv2.waitKey(0)
# save the image back to disk (OpenCV handles converting image
# filetypes automatically)
cv2.imwrite("newimage.jpg", image)

裁剪操作

直接使用切片操作即可。例如需要提取一个图像的矩形区域，从(85,85)开始，到(220,250)结束。 OpenCV将图像表示为NumPy数组，高度在前(行编号#)，宽度在后(列编号#)。

cropped = image[startY:endY, startX:endX]

import cv2

# load the input image and display it to our screen
image = cv2.imread('test.png')
cv2.imshow("Original", image)
# cropping an image with OpenCV is accomplished via simple NumPy
# array slices in startY:endY, startX:endX order -- here we are
# cropping the face from the image (these coordinates were
# determined using photo editing software such as Photoshop,
# GIMP, Paint, etc.)
face = image[85:250, 85:220]
cv2.imshow("Face", face)
cv2.waitKey(0)

算数操作

在进行图像运算时，需要注意颜色空间和数据类型的数值限制。通常来说，RGB图像的像素在[0, 255]范围内。如果在这个运算中超出这个范围，opencv和numpy的处理方法是不一样的。

OpenCV 执行剪切，并确保像素值永远不会超出范围[0,255]。
NumPy 执行模数运算和循环。例如265表示为9

import numpy as np
import cv2

# images are NumPy arrays stored as unsigned 8-bit integers (unit8)
# with values in the range [0, 255]; when using the add/subtract
# functions in OpenCV, these values will be *clipped* to this range,
# even if they fall outside the range [0, 255] after applying the
# operation

added = cv2.add(np.uint8([200]), np.uint8([100]))
subtracted = cv2.subtract(np.uint8([50]), np.uint8([100]))
print("max of 255: {}".format(added))
print("min of 0: {}".format(subtracted))
>>> max of 255: [[255]]
>>> min of 0: [[0]]

# using NumPy arithmetic operations (rather than OpenCV operations)
# will result in a modulo ("wrap around") instead of being clipped
# to the range [0, 255]

added = np.uint8([200]) + np.uint8([100])
subtracted = np.uint8([50]) - np.uint8([100])
print("wrap around: {}".format(added))
print("wrap around: {}".format(subtracted))
>>> wrap around: [44]
>>> wrap around: [206]

位运算AND, OR, XOR, and NOT

通常像素值0为黑，255为纯白，如果只有0和255，实际可以抽象为二值化图像。 opencv中处理逻辑运算使用命令bitwise_and, bitwise_or, bitwise_xor, bitwise_not.

import numpy as np
import cv2
# draw a rectangle
rectangle = np.zeros((300, 300), dtype="uint8")
cv2.rectangle(rectangle, (25, 25), (275, 275), 255, -1)
cv2.imshow("Rectangle", rectangle)
# draw a circle
circle = np.zeros((300, 300), dtype = "uint8")
cv2.circle(circle, (150, 150), 150, 255, -1)
cv2.imshow("Circle", circle)

# a bitwise 'AND' is only 'True' when both inputs have a value that
# is 'ON' -- in this case, the cv2.bitwise_and function examines
# every pixel in the rectangle and circle; if *BOTH* pixels have a
# value greater than zero then the pixel is turned 'ON' (i.e., 255)
# in the output image; otherwise, the output value is set to
# 'OFF' (i.e., 0)
bitwiseAnd = cv2.bitwise_and(rectangle, circle)
cv2.imshow("AND", bitwiseAnd)
cv2.waitKey(0)

# a bitwise 'OR' examines every pixel in the two inputs, and if
# *EITHER* pixel in the rectangle or circle is greater than 0,
# then the output pixel has a value of 255, otherwise it is 0
bitwiseOr = cv2.bitwise_or(rectangle, circle)
cv2.imshow("OR", bitwiseOr)
cv2.waitKey(0)

# the bitwise 'XOR' is identical to the 'OR' function, with one
# exception: the rectangle and circle are not allowed to *BOTH*
# have values greater than 0 (only one can be 0)
bitwiseXor = cv2.bitwise_xor(rectangle, circle)
cv2.imshow("XOR", bitwiseXor)
cv2.waitKey(0)

# finally, the bitwise 'NOT' inverts the values of the pixels;
# pixels with a value of 255 become 0, and pixels with a value of 0
# become 255
bitwiseNot = cv2.bitwise_not(circle)
cv2.imshow("NOT", bitwiseNot)
cv2.waitKey(0)

遮盖图像

本质上使用bitwise_and 操作即可

import numpy as np
import cv2
image = cv2.imread('test.png')
cv2.imshow("Original", image)
# a mask is the same size as our image, but has only two pixel
# values, 0 and 255 -- pixels with a value of 0 (background) are
# ignored in the original image while mask pixels with a value of
# 255 (foreground) are allowed to be kept
mask = np.zeros(image.shape[:2], dtype="uint8")
cv2.rectangle(mask, (0, 90), (290, 450), 255, -1)
cv2.imshow("Rectangular Mask", mask)
# apply our mask -- notice how only the person in the image is
# cropped out
masked = cv2.bitwise_and(image, image, mask=mask)
cv2.imshow("Mask Applied to Image", masked)
cv2.waitKey(0)

缩放scaling(resize)

当调整图像大小时，重要的是要记住宽度与高度比值，即图像的宽高比(aspect_ratio)。忽略纵横比可能会导致调整图像大小，看起来压缩和扭曲。另外图像放大过程需要注意插值(interpolation)方法。

cv2.resize

直接使用cv2.resize方法需要手动计算宽高比，以保证缩放比例正确

aspect_ratio = image_width / image_height

import numpy as np
import cv2
image = cv2.imread('test.png') 

# 调整为150像素宽度
r = 150.0 / image.shape[1]
dim = (150, int(image.shape[0] * r))
# perform the actual resizing of the image
resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)
cv2.imshow("Resized (Width)", resized)

# 调整为50像素高度
r = 50.0 / image.shape[0]
dim = (int(image.shape[1] * r), 50)
# perform the resizing
resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)
cv2.imshow("Resized (Height)", resized)
cv2.waitKey(0)

imutils.resize

可以使用imutils自动调整大小功能

import imutils
import cv2
image = cv2.imread('test.png') 
# calculating the ratio each and every time we want to resize an
# image is a real pain, so let's use the imutils convenience
# function which will *automatically* maintain our aspect ratio
# for us
resized = imutils.resize(image, width=100)
cv2.imshow("Resized via imutils", resized)
cv2.waitKey(0)

插值方法

cv2.INTER_NEAREST 最近邻域插值 cv2.INTER_LINEAR 双线性插值 cv2.INTER_AREA 区域间插值

以下为样条插值，使用情况较少，速度较慢 cv2.INTER_CUBIC based on a 4 x 4 pixel neighbor cv2.INTER_LANCZOS4 based on an 8 x 8 pixel neighborhood

通常，cv2.INTER_NEAREST非常快，但没有提供最高质量的结果。在非常受到资源约束的环境中，可以考虑该方法。

增加图像大小（上采样）时，考虑使用cv2.INTER_LINEAR 和 cv2.INTER_CUBIC。cv2.INTER_LINEAR 方法往往比 cv2.INTER_CUBIC 方法稍快，哪种更好自己尝试。

减小图像大小（下采样）时，OPENCV文档建议使用cv2.INTER_AREA。也可以使用cv2.INTER_NEAREST方法，但是cv2.INTER_AREA 通常效果更好。

最后，作为一般规则，建议使用cv2.INTER_LINEAR插值方法作为默认方法，上下采样都有较好的效果。

图像翻转cv2.flip

0表示垂直翻转（x轴），1表示水平翻转（y轴），-1表示两种操作都进行（180度）

import cv2
image = cv2.imread('test.png') 
# flip the image horizontally
print("[INFO] flipping image horizontally...")
flipped = cv2.flip(image, 1)
cv2.imshow("Flipped Horizontally", flipped)

# flip the image vertically
flipped = cv2.flip(image, 0)
print("[INFO] flipping image vertically...")
cv2.imshow("Flipped Vertically", flipped)

# flip the image along both axes
flipped = cv2.flip(image, -1)
print("[INFO] flipping image horizontally and vertically...")
cv2.imshow("Flipped Horizontally & Vertically", flipped)
cv2.waitKey(0)

图像旋转

cv2.rotate

旋转原理通常来说，旋转需要选择一个旋转中心和旋转角度，opencv还可以将图片进行缩放操作。使用cv2.getRotationMatrix2D定义一个旋转矩阵，第一个参数为旋转中心点，第二个为旋转角度（顺时针），第三个为缩放尺度。注意：在OpenCV中，正度表示逆时针旋转，负度表示顺时针旋转。

使用cv2.warpAffine应用旋转，第一个参数是想要旋转的图像。之后指定旋转矩阵M和图像的输出维度(宽度和高度)。

```python
import cv2
image = cv2.imread('test.png') 
# grab the dimensions of the image and calculate the center of the
# image
(h, w) = image.shape[:2]
(cX, cY) = (w // 2, h // 2)
# rotate our image by 45 degrees around the center of the image
M = cv2.getRotationMatrix2D((cX, cY), 45, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
cv2.imshow("Rotated by 45 Degrees", rotated)
# rotate our image by -90 degrees around the image
M = cv2.getRotationMatrix2D((cX, cY), -90, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
cv2.imshow("Rotated by -90 Degrees", rotated)

但是OpenCV并不会自动为我们整个旋转的图像分配空间以适应大小，可能会翻转到图像外面去。这个就需要调整cv2.warpAffine中的(w,h)来改变，比较麻烦。

imutils.rotate和imutils.rotate_bound

imutils.convenience.rotate 为一个封装的方法，代码显得简化许多。

import cv2
import imutils
image = cv2.imread('test.png') 

# use our imutils function to rotate an image 180 degrees
rotated = imutils.rotate(image, 180)
cv2.imshow("Rotated by 180 Degrees", rotated)

如果旋转过程中图像的一部分被切断，OpenCV不会分配足够的空间来存储整个图像，这时候可以使用imutils.convenience.rotate_bound解决

# rotate our image by 33 degrees counterclockwise, ensuring the
# entire rotated image still renders within the viewing area
rotated = imutils.rotate_bound(image, -33)
cv2.imshow("Rotated Without Cropping", rotated)
cv2.waitKey(0)

分离合并通道

使用cv2.split 和 cv2.merge即可

import cv2
import imutils
image = cv2.imread('test.png') 
# load the input image and grab each channel -- note how OpenCV
# represents images as NumPy arrays with channels in Blue, Green,
# Red ordering rather than Red, Green, Blue
image = cv2.imread(args["image"])
(B, G, R) = cv2.split(image)
# show each channel individually
cv2.imshow("Red", R)
cv2.imshow("Green", G)
cv2.imshow("Blue", B)
cv2.waitKey(0)

# merge the image back together again
merged = cv2.merge([B, G, R])
cv2.imshow("Merged", merged)
cv2.waitKey(0)
cv2.destroyAllWindows()

画图功能

常用命令

cv2.line : 在图像上绘制一条直线，从指定的(x, y)坐标开始，结束于另一个(x, y)坐标
cv2.circle : 在由中心(x, y)坐标和提供的半径指定的图像上绘制一个圆
cv2.rectangle : 在左上角和右下角(x, y)坐标指定的图像上绘制矩形还有其他命令
cv2.ellipse : 绘制椭圆形
cv2.polylines : 绘制由一组(x, y)坐标指定的多边形的轮廓
cv2.fillPoly : 绘制一个多边形，但不是绘制轮廓，而是填充多边形
cv2.arrowedLine : 绘制一个箭头，从起始(x, y)坐标指向结束(x, y)坐标

# import the necessary packages
import numpy as np
import cv2
# initialize our canvas as a 300x300 pixel image with 3 channels
# (Red, Green, and Blue) with a black background
canvas = np.zeros((300, 300, 3), dtype="uint8")

# draw a green line from the top-left corner of our canvas to the
# bottom-right
green = (0, 255, 0)
cv2.line(canvas, (0, 0), (300, 300), green)
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)
# draw a 3 pixel thick red line from the top-right corner to the
# bottom-left
red = (0, 0, 255)
cv2.line(canvas, (300, 0), (0, 300), red, 3)
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)

# draw a green 50x50 pixel square, starting at 10x10 and ending at 60x60
cv2.rectangle(canvas, (10, 10), (60, 60), green)
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)
# draw another rectangle, this one red with 5 pixel thickness
cv2.rectangle(canvas, (50, 200), (200, 225), red, 5)
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)
# draw a final rectangle (blue and filled in )
blue = (255, 0, 0)
cv2.rectangle(canvas, (200, 50), (225, 125), blue, -1) #-1表示全部填充
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)

画圈

# re-initialize our canvas once again
canvas = np.zeros((300, 300, 3), dtype="uint8")
# let's draw 25 random circles
for i in range(0, 25):
	# randomly generate a radius size between 5 and 200, generate a
	# random color, and then pick a random point on our canvas where
	# the circle will be drawn
	radius = np.random.randint(5, high=200)
	color = np.random.randint(0, high=256, size=(3,)).tolist()
	pt = np.random.randint(0, high=300, size=(2,))
	# draw our random circle on the canvas
	cv2.circle(canvas, tuple(pt), radius, color, -1)
# display our masterpiece to our screen
cv2.imshow("Canvas", canvas)
cv2.waitKey(0)

图像平移

与图像旋转类似，需要先定义一个平移矩阵，之后使用cv2.warpAffine 方法进行调用

平移矩阵如下：其中第一行表示左右移动，shiftX为负，向左移动，shiftX为正，向右移动。第二行表示上下移动，shiftY为负，向下移动，shiftY为正，向上移动。

M = np.float32([
	[1, 0, shiftX],
	[0, 1, shiftY]
])

import cv2
image = cv2.imread('test.png') 
# shift the image 25 pixels to the right and 50 pixels down
M = np.float32([[1, 0, 25], [0, 1, 50]])
shifted = cv2.warpAffine(image, M, (image.shape[1], image.shape[0]))
cv2.imshow("Shifted Down and Right", shifted)

同时也可以用imutils.translate方法，更加简洁一点。

# use the imutils helper function to translate the image 100 pixels
# down in a single function call
shifted = imutils.translate(image, 0, 100)
cv2.imshow("Shifted Down", shifted)
cv2.waitKey(0)

2023年Flag

Mon, 30 Jan 2023 13:33:00 GMT

虽然晚了一些，但是2023年的Flag还是要立下的。去年的目标实现的并不是很好，今年还是要改进一下方法和反馈机制。决定以年为单位使用OKR的方法来进行实践。

OKR

OKR（Objectives and Key Results）目标与关键成果法，这其中：

O是目标，回答的是「我想要完成什么？」，是某个时间段内的目标和任务。目标的前提由动机和可行性组成。
KR是一系列可衡量的关键结果，回答的是「我如何知道自己是否达成了目标？」。这其中可以使用限制词将具体的事转变为结果。

具体一些其他人的实践案例可以参考这两篇文章：

其中第二篇文章给我带来了很大的启发，本文中很多东西都是参考他的体系去构建的。

生命之花模型

由于涉及到个人的管理，所以参考生命之花模型，定义上来说，生命之花模型分为下面八个组成：
职业发展、财务状况、个人健康、娱乐休闲、家庭生活、朋友他人、个人成长、自我实现。

接下来我将家庭生活和朋友他人两项合并一下。共计七个方面指定下计划。

自己的OKR规划

O1 职业发展精进技术，找新工作

KR1 继续完善专业相关知识

之前在公司工作，技术水平去完成那份工作是适合的。不过有些时候还是觉得力不从心，需要不断精进自己的技术，加强自己的专业性。

A1 现有知识点梳理整理笔记

虽然之前学习过很多机器学习和深度学习的相关知识，但是没有整体上把他们整理过。借助整理的过程，把一些技术的知识点和代码整体复习一遍。

A2 学习精进python

之前都是断断续续的学习python，没有一个完整并反馈的流程，虽然上一份工作不需要那么严格的python代码技术，但是有些基础的思想还是需要重新去系统的学习一下。

A3 学习精进深度学习技术

pytorch的代码技术水平一般，需要多读读别人的相关与源码，同时技术革新较快，需要大致了解一下其他技术的更迭项目以保证不落后。包括但不仅限于分类任务，分割任务，检测任务等等。同时OpenCV也希望好好学习一下。

KR2 找到一份合适的工作

新工作希望回到合肥进行发展，而且工作内容希望能够偏向上一份工作的医学影像处理。但是不仅仅限于这些，需要一些机遇结合实力去进行调整。

A1 调整心态与收集信息

找工作不是一件容易的事情，而且我还有特定的专业性，因此需要沉住气，自己的应届生身份已经没有了，所以也不需要特别的着急。稳定好自己的情绪，多多关注自己的目标行业，寻找合适的机会。

A2 根据形势实时调整

计划赶不上变化，特别是工作，需要好好地动态调整自己的目的。我更在意工作对自己的影响而不是工作本身。

O2 财务状况

KR1 记账预算系统保持收支平衡

坚持记账几年了，还是比较有经验的。但是渐渐的需要步入人生新的阶段，还是需要不断调整预算完善系统。

KR2 理财知识的系统学习

之前学习过一段时间，但是没有系统的记录与整理。今年需要整理这方面的知识。

A1 知识星球和公众号一些内容的持续阅读

这些知识更新的比较快，也有一些其他投资者的感想，所以需要去好好跟进学习整理。

A2 投资书籍阅读

系统性的学习少不了专业书记的帮助，阅读并做好笔记内容。

KR3 理财实操继续

学生时代实践过一段时间，碍于手头的资金等等没有持续进行。不过得到的经验是，没有充足的时间与精力不要参与股票的交易，水还是比较深。今年还是继续跟着投长线吧。

O3 个人成长保持好奇心，输出分享

KR1 整理并管理好自己的信息输入

被动性的输入多且杂，希望能够将自己的信息源进行筛选改进，并改进消化流程。

A1 重新整理自己的信息源

包含但不限于rss，newsletter，telegram频道，视频网站，播客等等。分别使用不同的工具进行管理。

A2 笔记系统的完善

现在在用的有很多软件，obsidian，notion，滴答清单等等。需要整理好自己完善的笔记系统，并做好备份工作，不断收集消化新的知识。

KR2 保持日常的输出分享

有些东西有价值的东西可以分享出来，也便于后续自己查阅。
自己不喜欢用朋友圈，觉得负担太大。之前一直用flomo记录，但是发现也用的不多，双链功能自己也基本上用不上。不过发现了一个开源项目memos。它类似于备忘录，但是可以公开分享的内容，正好是一个好的分享平台。希望简短的内容可以通过他进行分享，同时也在自己的telegram频道中进行记录。

KR3 保持每月的写作输出

在自己的博客进行写作是一件坚持了很久的事情，新的一年也要继续，去年只写了9篇，虽然说不是因为没有时间，总是感觉差点思考与意思。新的一年希望能够保证至少每月一篇的输出且内容更加丰富。

O4 自我实现新领域的探索永无止境

KR1 音乐的重新拾起

大学时期组建过乐队，和朋友度过一段快乐的时光。前段时间看了「孤独摇滚」，重新想起了以前在音乐中的日子。虽然我无法将它作为自己的职业，但是我仍然不想抛弃它们，作为一种兴趣不断陶冶自己也是好的体现。

A1 电吉他的重新拾起

好久没玩过它了，继续重新回来吧。

A2 乐理知识重新学习

由于买了midi键盘，也回到家了。重新系统的学习一下乐理知识，练习一下即兴技巧，不然永远只是一个单单模仿的笨蛋。

A3 曲子录制

希望能够实现，但是有点难度。

KR2 英语精进

英语一直是我的一个痛，虽然很多东西差不多能看懂，翻译软件也很方便，但是还是需要去刻意练习提升一下。

A1 英语文章与文献阅读

从日常中去阅读是最有效的方法，通过读一些英文文章和文献，把不会的单次用欧路词典记录下来。直接学习背诵。

A2 英语影片听力练习

刻意去听一些英语的相关内容，去培养增强自己的词汇量。

O5 个人健康保持健康的体魄

KR1 保持良好的作息

每周能够保持40个睡眠周期（1.5小时算一个，中午小憩30min算一个）。工作日期望睡眠时间：0:30~8:00 共5个睡眠周期。

KR2 保持锻炼

A1 室内体能维持锻炼

使用瑜伽垫在家里锻炼。每周至少3次。一次时间不用多，20~30min。

A2 室外锻炼

跑步或者骑行，锻炼下肢力量。真的很久都没有跑步了。

O6 朋友家庭多多和别人保持沟通

KR1 每周和女朋友见面

之前我们俩一直是异地，见面在一起的日子真的很少。之后在可以的日子希望每周都能够见面，好好地培养感情。

KR2 每月都能和好朋友进行聚餐游玩

聚会是很好的过程，增进情感与联系，和好朋友留下和的回忆。

KR3 多陪伴家人

虽然现在一直住在家里，但是之后随算搬出去住也要时刻保持联系。之前在外地是每周六都会和家人视频，以后也要坚持。

O7 娱乐休闲尝试不一样的事情

KR1 每周都可以去不一样的地方好好吃饭

在新的地方去吃些好吃的，并记录下来，吃吃吃还是很有意思的。

KR2 多外出走走

读万卷书，行万里路，希望能够去不同的地方与城市，去看看不一样的风景。

总结

之前也会立flag，但是往往不能够完成，这次使用新学习到的OKR系统来重新指定一次目标，并做好量化与追踪的方式，希望新的一年能够有更大的收获。

在了解生命之花模型之后，我发现工作实际上应该只占据人生的一小部分，而且它也应该只占据生命的一小部分。之前的一段工作经历感觉工作真繁忙，占据了大部分时间。而且觉得现在社会真心的卷，妈妈他们一辈也没有这么辛苦，兄弟姐妹也不少，照样能够把孩子各个都拉扯大。甚至看一些其他国家人民讲述以前的故事，往往都是爸爸在一家工厂里工作，也能够养活一家子人。而现在社会感觉养活自己都很不容易，这还挺奇怪的。不过生命更多的是应该为自己活，活得有价值与成就感就好了。

2022年度总结

Sun, 25 Dec 2022 11:48:15 GMT

回首2022，似乎太快太快，在学校中的日子很快，在社会中的日子显得更快。当我还在回首2021年的往事之时，不知不觉2022也已经走到了尽头。

硕士毕业

要说2022最大的变化，就是自己结束了持续19年的求学生涯，小学6年，初中3年，高中3年，大学4年，研究生3年。今年6月，在完成完毕业论文的答辩后，我终于拿到了工学硕士的毕业证书。

回首研究生的这三年，更多时候也可以称为被疫情支配的三年，除去19年下半年的自由时光，其他时间或多或少都被疫情所占据了。当时要说水，我也比其他同学学习了更多的知识，要说优秀，论文又是一篇也没有发出来。不过好在学校的生活不是特别痛苦，过程美满我也是很知足了。最后这半年，毕业论文完成了，毕业旅行也做了，一切就像在炎炎夏天一口炫进一个香草味的冰淇淋，透心凉而真心爽。

北京工作

整个下半年步入了工作阶段。由于特殊原因，毕业后来到了北京。虽然也想过回家，但是身不由己，那倒不如出来磨练自己一段时间。北京这座城我还没有过多的探索，主要原因还是自己的慵懒与疫情的反复。

工作中认识了不同的人，遇见了新的领导，和新的室友们共住在一个屋檐下，一切都是新的开始。有时会和在北京的同学一起吃饭聊聊天，说说笑笑，也会感叹大家都不容易。工作有时候挺繁杂的，而且看着公司裁员，同事一个个减少，有时候也会有焦虑，不过想想自己的目标与目前的资历，也觉得释怀。还能有份工作已经很不错了，而且工作也算锻炼人，继续加油吧。

感情生活

今年和女朋友出去玩了几次，看过了许多美好的风景，也见过了不少美好的回忆。即便一年过程中也有些吵吵闹闹，但也都还是过来了。现在最大的问题是我们处于异地的状态，很久才能见一次面。这个终局应该是我要回到家那边的，但具体是什么时候，也还是一个问题。现在就是继续维持，努力攒钱提升自己先吧。

物质生活

我可喜欢买买买了，虽然大多数都是在闲鱼上找基本没咋用的二手货。今年购入的新玩意有：三星S22 Ultra手机，三星buds pro耳机，三星galaxy book2 pro 360电脑（实际体验一般），这样终于是把三星全家桶凑齐了而且又更新换代了一波。还购入了入门级的玩具midi键盘，兴趣还是希望不要丢掉呢。外加最爱的宝可梦阿尔宙斯和宝可梦朱紫卡带。其他似乎没有特别影像深刻的了。

精神世界

今年没有太大的长进，毕竟刚刚出来象牙塔。但我似乎也明白了一些，很多时候做事情都是人情世故，单打独斗还是不得取。自己就算再强，到达特定瓶颈还是会止步不前。当然实力与资质才是未来前进的资本。真正重要的事情做好，做对，有些时候就已经足够了。

不过我发现自己还是在不断追求探索新奇的东西，这说明我还没老，没有被生活所磨平棱角。

今年也算是进步和改变比较大的一年了，圣诞节写下这篇回顾，希望明年的自己也会好好的。也祝福大家圣诞节快乐，新的一年健健康康，开心最重要。

生命之轻

Sun, 27 Nov 2022 10:04:48 GMT

好久没有写博客了，有很多很多的事和很多的话想说，但是一忙，一怠惰，便觉得无非也就事那样，写不写也无所谓了。

纵然我见证着社会的离谱与权贵的粉墨登场，但我有时候也会觉得那很遥远。即便已经被疫情封在家中，看着各地方仍为了清零这个伟大胜利而不懈努力与抗争时，一次次的做着核酸，一次次的扫码行程记录，一次次的隔离封小区，让我惊叹的仅仅是政府的财力，自己逐渐变得麻木不仁。

昨晚一如往常和家人视频聊天，聊疫情，聊生活，聊几点睡觉，聊吃的好不好。日常的生活才更多的反映出了真实的点点滴滴。说着说着，妈妈说：

“不知道你还记得妞妞嘛，她妈妈死了。”

“这么突然的嘛”，我先是一愣，“是住在5楼的那户嘛？”

“是的，据说是子宫癌，开刀直接在没下的来手术台”。妈妈叹了口气，说道。

虽说也不是特别多的交集，也很久没见过，但我脑海中还是可以浮现出那位阿姨的印象。小时候还看她经常性的上下搬动自行车，很是干练健康的样子。

“还有那个谁，不知道你记得不，XXX，他昨天也死了。也不知道什么原因，可能是高血压糖尿病并发症发作”，姥姥补充道，“他们家人都不敢告诉他奶奶，怕他奶奶承受不住。”

那个哥哥我是知道的，像个小混混一样，但是和谁都混的挺开，包括社区里的老人，人人都知道他。我还记得小时候经常逗我玩，还叫我姥姥高价买他的小狗。姥姥经常调侃他，而他也就笑嘻嘻。

“他生下来时候就一身的病，妈妈当时生他时候就去世了，他爷爷为了给他看病，卖了好多东西，为了保住这个小孙子。他爷爷之前可有钱了，为了小孙子也是散尽了家财，能长这么大都是拿钱换来的，可惜现在也死了。之前就看他那个腿，都是紫的，问他他自己也明白，说治不好的，自己倒是看的很开，总是笑嘻嘻的”。

“他多大了呀？”

“大概也就40岁不到吧，可怜了他还有个小儿子，看着白白净净怪可爱的。”说到这里我看到明显姥姥的眼眶中有泪水在打转。

“哎，至少他的小儿子还有爱他的妈妈和爷爷”，我安慰道，“而且他能活这么大，他家人应该也很开心了”。

身边的人逝去，一想起他们曾经鲜活的面容，我还是难免鼻头一酸。

之前也总是不理解为啥有些人千金散尽去治病，还觉得他们傻，只能说当事人不是你你就没有资格去做评判。人就是这样说别人的时候好像很理性，然而真实的情况又是那么复杂，人是充满感性的，而这也没有什么不好。什么灾难没有压到你头上之前有些人就是觉得无所谓，看网络上的内容指指点点，身边的人经历后有所触动，而到自己经历了才意识到真正的大难临头，抓狂，无助，但是如果挺了过去，有些人就会蜕变成真正的狠人。

还有，有些东西是天灾，有些却是人祸。有些东西是共同克服的目标，而有些只是为了自己仕途的政治工具。批判以前的裹小脚是陋习，现在却天天搁着裹小脑。恐慌，坚持，胜利，伟大，有些东西说多了，群众都不信了，说的人反而快相信了。

要说世界上有神我暂时还是不信的，但要说世界上真的没有什么神奇的力量我是更不信的。真正做恶之人必将在某些维度中收到他应受的惩罚。在这祝福希望逝去的人们一路走好，而他们的家人们能够继续勇敢的活下去。

中秋轶事

Mon, 12 Sep 2022 10:03:10 GMT

中秋礼物

中秋节回了趟家，实际也就短短2天。朋友们都问我为啥不国庆回而是选择中秋回，只能说中秋的意义远远大于国庆的意义，毕竟这是工作后第一次回家的好时机，而且姥姥和女朋友的生日也在中秋节。
工作赚了钱钱，肯定要先想着给家人买点东西，毕竟这是25年来自己真真切切拿到的薪水。思索了半天，脑海中浮现一万个念头。在一个个排除之后，觉得还是黄金最合适，高雅且不掉价，而且作为一种硬通货，大家永远不会嫌弃黄金多。
利用空闲时间去王府井转了一下午，最终给姥姥买了一个黄金凤凰耳坠，给妈妈买了一个黄金花花戒指，战果丰富，满载而归。

回家旅途

回家选择做的是绿皮火车的卧铺，计划是睡一觉便可到家。坐高铁时间有点紧，到家这边估计要得12点往后了。上次坐卧铺，记忆中好像还是很小的时候和家人出去西安走亲戚，摇晃的车厢吱吱作响，看着窗外往后逃走的树木群山，我靠着窗精神恍惚，无聊至极，后面想起mp4上有下载的侦探小说才又将我从混沌中解救。
这次上车时间是晚上8点，刚到卧铺附近就看到两个大叔坐在旁边吃吃喝喝。由于我买的是上铺，在下面做了一会感觉好不自在，于是赶紧一跃飞身上床，这样也可以俯视暗中观察下面的动态。哇，烧鸡，花生米，啤酒，好快活呀。大哥们吃着凉菜，哈着啤酒，中途又遇见了他们的同事，又又遇到了他们的老同学，一行人吃吃说说，说工作，说孩子，说味道，车厢里充满了热闹。我忽然就觉得自己好像被拯救了，一下子回到了人世间，玩着手机，大哥们说话当做bgm，好真实好真实，好有生活味。

车厢夜里10点就熄灯了，天天12点睡觉的人当然睡不着，上铺的空调吹得我冷，盖上被子又热🥵，辗转反侧与半梦半醒之中，天亮了。
车7点45到达目的地，6点多车厢就开始卖早饭吆喝，但困困的我还是7点多才从床上勉强爬起。看着镜子前的人大油头，乱糟糟的头发，仿佛从哪里逃难回来，真心想找个地缝钻进去。不过反正没人认识我，我再丑出再大糗又何妨，管他呢哈哈。

中秋团圆

下了车，又是做核酸又是排查地区，不想说啥，火车站离我家并不远，但我9点多才到家。回到家中看见家人的笑脸，如常。洗漱补觉后，给她们带的礼物，中秋快乐，生日快乐。明显大家都很开心，东西也很合适。家里的饭菜还是那味，家里的床更有安心满足感。家里吃了月饼，流心馅的，感触与满足也流到了心中。

第二天陪女朋友过生日，去了动物园看动物。动物园的时光仿佛静止了，感觉和我小学来看的没啥两样，我们走的腿脚发软，女朋友被虫子咬得浑身痒痒。晚上去买了蛋糕，一起度过了她25岁的生日。陪伴才是最长情的告白。

返程

一转眼又到了回程工作的日子，虽然我说不用不要来送我，但家人还是把我送到了南站高铁站，她们和我在站口拍了照片，依依不舍地看着我入站，消失在茫茫人海。我忽然能够体会有些人跋涉千山万水过年回家，吃完团圆饭后又匆匆离开的心情了。那是情感与生存的矛盾，也是现代生活的一种悲哀。我想到大学和研究生这7年中秋节都没有回家，无非也就是生存成本问题，不过后面还有疫情的强制管控问题。多回家看看，还是好的。

2022年9月12日

詹詹碎言 #5

Sun, 14 Aug 2022 09:17:36 GMT

放空

最近觉得很疲惫，要说原因可能是因为开始上班了，习惯啥的还没调整过来。时时刻刻就想睡觉放空自己，这不，周末基本在家躺了两天，好像是个废人了。

现在觉得最重要的就是将工作与生活要分隔开。因为我现在处于高速学习状态，所以难免需要用私下的时间去不断学习整理已有的知识并为自己所用。有时候觉得一天很充实，但也真的是头昏脑胀。下班了我就是想直接躺平。

周五的时候把之前写的项目代码重新整合了一下，以便后续方便使用。于是乎调了几乎一整天的代码，好家伙，那电脑看的我真是是觉得是天旋地转。看来我是不适合当一个天天都要码代码的程序员，现在的科研岗选择还是较为正确的。

但是觉得似乎现在的自己缺少了什么，想了想可能是表达。自己又不喜欢发朋友圈，那些看到的东西也不好转载，都窝在肚子里还是挺难受的，我还是要分享！我决定了，本社恐还是把生活和见闻多多分享在自己的telegram频道里面吧！链接如下：

詹詹碎言，分享好玩

这感觉会非常有趣！希望有兴趣的朋友可以订阅听我随便逼逼。

哼，这个小段落就是个碎碎念，也是个小小改变与flag啦！

播客

又开始听播客了，之前大概在17到19年那会听了很多的播客，使用的软件是pocket casts。那时候播客在中国还是一个较为小众的东西，但是实际不乏一些有趣的内容，像是「疯投圈」，「创业内幕」，「迟早更新」，「得意忘形」等等。每个播客都有自己不同的出发点，相较于单纯的文字，音频似乎显得更加放松；相较于视频，音频也不用耗费太多的精力。总体来说，我对播客的定义就是一种适合在通勤或者低脑力劳动下去听的一种低密度媒体，说白了就是听着玩，长长见识，听听别人的观点。而且能够听到别人的声音相较于干瘪的文字更能触动人。那时候似乎播客创作主也更多的都是兴趣驱动，个人分享。

近几年短视频长视频平台都兴起，疫情在家的一段时间感觉完全磨灭了我之前保持美好理想与习惯。那段时间自己的娱乐逐渐被b站的那种视频所占据，播客听的也就少了很多甚至基本不在打开软件。一天天刷完那些破视频，又疲惫，又浪费。现在的我看来，很多视频真的是毫无意义，毕竟有人靠这个吃饭，但饭有很多种吃法，自己吃的香，别人的体验也就不在乎啥了。

然后现在又开始听播客了，可能是上下班的路程有点无聊，老是听歌又显得有些枯燥。而且发现现在中国的播客市场很明显丰富了一些，甚至出现了中国特有的app：小宇宙。虽然我是一点也没有用过啦。但这无疑是件好事，有了本体的一些土生土长的圈子才能慢慢发展。前些天在少数派看来一篇介绍中国播客发现现状的文章：一篇文章，读懂中文播客前世今生。文章写得很好，中文播客确实还有很长的路要走，当时充满了机会和挑战。作为一种「涨姿势」的媒介，我还是希望能够听见不同的人去分享他们的生活，他们的日子，带有高级，却也如同面对面的朋友，没有乌烟瘴气的弹幕，也没有那么多自以为是的评论，听完了更多是会心一笑，感慨世界之大与精彩。这也叫足够了。

MRI序列

Sun, 17 Jul 2022 09:29:52 GMT

工作中要用到MRI的一些知识，这里先做一些简单的整理，后续会持续整理更新。

术语描述

强度/intensity

在描述大多数 MRI 序列时，通常用intensity这个词来指代组织或流体的灰色阴影（强度）。因此有如下的术语描述：

绝对术语描述：

high signal intensity = white
intermediate signal intensity = grey
low signal intensity = black

相对术语描述：

hyperintense = brighter than the thing we are comparing it to
isointense = same brightness as the thing we are comparing it to
hypointense = darker than the thing we are comparing it to

优选使用绝对术语，或者如果使用相对术语，则需要写明确认比较的组织结构

tips： CT中描述强度使用density，避免混淆使用！

扩散/diffusion

在描述扩散加权序列(diffusion weighted sequences)时，也使用术语强度/intensity。使用术语“限制扩散restricted diffusion”和“促进扩散facilitated diffusion”来表示水是否可以比预期的组织更容易（限制）或更容易（促进）移动。

序列分类可以参考这篇文章的分类：MRI sequence

MRI序列

MRI仅能探测横向宏观磁化矢量。而氢质子进入高能状态后，可以产生此类矢量。

根据核磁弛豫可以产生不同方向的能量，可以做出不同分类。

T1加权/T1 weighted

也叫纵向弛豫，主要是氢质子高能量的释放过程（时间）。

组织的T1越小，对应在MRI影像上信号强度越高（白）；T1越大，影像上信号强度越低（黑）。

不同组织的信号强度为:

脂肪：白色 high signal intensity
肌肉：灰色 intermediate signal intensity
流体（尿液，脑脊液）：深色 low signal intensity
流动的血液：深色 low signal intensity
骨：深色
空气：深色
脑：
- 灰质：灰色
- 白质：明亮（与灰质相比高信号）hyperintense compared to grey matter (white-ish)

T1 最适合用于评估解剖结构，因为图像在宏观上类似于组织。

T1对比增强/T1+Contrast (gadolinium)

注射造影剂（钆）会增加流动血液的 T1 信号，从而可以检测到高血管病变。

可用于评估高血管病变（例如血管瘤、淋巴管瘤）。

T1脂肪抑制/T1 fat suppressed

目的是检测通常含有大量脂肪成分的软组织中的水肿。抑制来自脂肪的信号可以使具有高信号的液体成分更加明显。

T2加权/T2 weighted

也叫横向弛豫，主要是氢质子失相位过程（时间）。

组织的T2越小，对应在MRI影像上信号强度越低（黑）；T1越大，影像上信号强度越高（白）。

通常来说T1远远大于T2。

不同组织的信号强度为:

脂肪：白色 high signal intensity
肌肉：灰色 intermediate signal intensity
流体（尿液，脑脊液）：白色 high signal intensity
流动的血液：深色
骨：深色
空气：深色
脑：
- 灰质：灰色
- 白质：灰暗（与灰质相比低信号）hypointense compared to grey matter (dark-ish)

T2脂肪抑制/T2 fat suppressed

类似T1脂肪抑制

液体衰减反转恢复/Fluid Attenuation Inversion Recovery (FLAIR)

该序列衰减来自流体（例如CSF“脑脊液”）的信号，因此有助于检测通常被CSF覆盖的病变（在大脑和脊髓）。

磁敏感加权/susceptibility weighted imaging (SWI)

能够区分出钙和血液，SWI在显示脑内小静脉及出血方面敏感性优于常规梯度回波序列。

Short Tau Inversion Recovery (STIR)

与 FLAIR 序列类似，STIR 抑制来自脂肪组织的信号。

STIR 不能在注射钆后使用，因为钆的 T1 在相同的脂肪范围内，最终来自它的信号会减弱。

脂肪：深色
肌肉：比脂肪更黑
流体：非常明亮
骨：深色
空气：深色
脑：
- 灰质：灰色
- 白质：比灰质更暗

在评估充满液体的空间时最有用。

质子密度加权/Proton density weighted imaging（PDWI）

一个中间序列，共享 T1 和 T2 的一些特征。它主要取决于质子的密度。因此，密度较高的组织会发出更亮的信号。

在评估关节方面非常出色，因为它们可以区分流体、透明软骨和纤维软骨。

脂肪：白色
肌肉：灰色
流体：白色
骨：深色
空气：深色
透明软骨：灰色
纤维软骨：深色

扩散加权序列

扩散加权成像评估水分子在组织内移动的难易程度（主要代表细胞外空间内的液体），并深入了解细胞结构（例如肿瘤）、细胞肿胀（例如缺血）和水肿。

不同组织的主要信号强度为：

液体（如尿液、脑脊液）：不限制扩散
软组织（肌肉、实体器官、脑）：中间扩散
脂肪：由于缺水，信号微弱

通常在进行弥散加权成像时会发现三组图像：DWI、ADC 和 B=0 图像。

传统DWI/diffusion weighted image（DWI）

DWI 专门检测水分子中质子的运动。它代表了实际扩散值和 T2 信号的组合。

脂肪：由于缺水，信号微弱
肌肉：灰色
流体（CFS）：深色
脑：
- 灰质：灰色
- 白质：灰暗（与灰质相比略低）

急性病理（缺血性中风、细胞肿瘤、脓液）通常表现为信号增强，表明扩散受限。而且重要的是，由于图像中有一部分来自 T2 信号，一些在 T2 上明亮的组织在 DWI 图像上会显得明亮，而不会出现异常受限扩散。

表观扩散系数图/Apparent diffusion coefficient maps（ADC）

ADC表示没有 T2 效应的组织的实际扩散值的图像。并且可以获得扩散值的客观度量，基本上显示为灰度倒置 DWI 图像。

CSF：高信号（白色）
脂肪：由于缺水，信号微弱
其他软组织：中等信号强度（灰色）
脑
- 灰质：中间信号强度（灰色）
- 白质：与灰质相比略高

急性病理（缺血性中风、细胞肿瘤、脓液）通常表现为信号减弱，表明扩散受限。

B=0

本质上是 T2 加权图像，具有一些易感性影响。

Diffusion tensor（DTI）

用于评估肿瘤引起的白质变形，减少的分数各向异性可能表明痴呆。

功能性MRI/Functional MRI（fMRI）

大脑非常紧密地局部控制其血流。活动组织表现出升高的血流量

灌注加权/Perfusion weighted (PWI)

流入组织的血量也可以被检测和相对量化，产生诸如脑血容量、脑血流量和平均通过时间等值。这些值在许多临床情况下都很有用，包括定义缺血性中风中的缺血半暗带、评估某些肿瘤的组织学分级或区分放射性坏死和肿瘤进展。

参考文章

青岛之旅

Sun, 26 Jun 2022 03:44:57 GMT

工作了之后就没有时间了，本着及时行乐的态度，毕业后赶紧跑回家，来一趟轰轰烈烈的毕业旅行。

和女票挑了半天，最终选择去能看见大海的旅游城市：青岛。

基本准备

不算上在路上的时间，我们整体在青岛待了四又二分之一天。时间还算充裕，加上我们6月去的时候人不算太多，可以不太累的慢慢玩，也算是比较惬意。

旅行的地点基本上都是女票选择的，我充当好人行自走挂件的角色。衣物，数码产品，药物，还有最重要的凉鞋。穿着凉鞋行走在海滨城市的惬意是无法用言语形容的，脚沐浴在海风之中，感觉摆脱了许多束缚，就是走多了有点痛。

去的时候订的高铁，回来时候坐的飞机，目的就是有不一样的体验。青岛很多景点6月1号都免费开放给游客游玩，可以提前预约好门票或是借助万能的闲鱼，不亏的价格带来不菲的体验。想要什么都可以在手机上操作，着实是非常方便。

沿途景色

青岛海昌极地海洋公园

这个项目是付费的，实际还有一个免费海洋世界，但是预约不上。馆里有非常美丽的白鲸，机智的海豚，憨憨的北极熊，绅士企鹅和海底的一些鱼类和水母。还有从不缺少的海洋动物表演，海豹，海象，海狮齐聚一堂，好不热闹。

我也看过其他的海洋世界，可能听海底世界有时会觉得老套，但是每次去看又会觉得惊喜与开心。它就是那么一个让大家都会很开心的地方。

青岛啤酒博物馆

国内啤酒哪个有名，青岛啤酒当属上榜。说是博物馆，实际也是个青岛啤酒生产工厂，你可以走在工厂上面透过玻璃看到一部分青岛啤酒生产的过程。在里面可以尝到用黑啤和白啤制作的冰淇淋，混合起来还是不错的。博物馆承载的不仅仅是青岛啤酒的历史，也是青岛人民的生活，喝啤酒，吃蛤蜊，生活也好不快活。

崂山风景区

崂山风景区不仅有山，还有海。我们到了风景区的脚下，没有去选择爬山，而是乘坐风景区的小公交观赏绵延的海陆风景，好看到地方就在公交车站下车，拍照留下宝贵的回忆。我们在半山下车，沿着小路一路走到下面的海边，赤脚走在柔软的沙子上，海风加浪花，顿时风景便变得更加美丽了。

小麦岛

城景中看日落的好地点，可以看到太阳缓缓地落入鳞次栉比的高楼之中，海与城的景色在落日的余晖中显得格外温柔。就是岛上风有点大，吹得我们瑟瑟发抖。

城市中的美景

根据小红书上的指示，我们逛了很多的网红地点：大学路的网红墙，实际就是一段红色的墙壁，拍照片的人还挺多的。附近也有很多设计的漂漂亮亮的小店供拍照使用。信号山公园，一个海拔大概100米左右的小山，爬上去之后可以简单看看远处的景色。天主教堂，挺宏伟的一个大教堂，不过好像是封闭的。总督府中也看到了一些历史的痕迹。还有栈桥，远远的延伸出海边，360全方位海景观赏。

帆船

旅途中一个让我很满意的就是做到了大帆船，几百万的大船60一个人，带你在大海上逛一圈，老板自己都在说基本上是在做公益了。船体叫吉祥号，偌大的帆船上加上船长就只有9个人，拂过的海风，激起的海浪，远处的风景，还有心爱的美人。来海边看到这种快艇，游船，帆船我都会蠢蠢欲动，每次都是实打实的能够感受到快乐。

五四广场灯光秀

五四广场算是一个地标性的建筑了，为了看它的灯光秀我们特意多停留了一天。灯光秀实际上是后面的高楼组成的巨大荧幕，在特定时间段重复播放一些城市印象。我一开始还以为是无人机之类的表演，有些许的失望。不过广场上的氛围还是有的。形形色色的人，还有在街头唱歌的，充满了生活气息。

吃吃喝喝

我最喜欢的就是去不同的城市吃吃喝喝，青岛要说最具特色的应该就是吃海鲜喝啤酒了，但由于女票海鲜过敏也就没咋吃。不过这边的韩餐和烧烤还是很多的，不同的小店都各有千秋。你可以花十几块钱买一斤用袋子装的啤酒原浆，在小吃街上乱逛，麻辣拌，大葱肥肠，烤猪蹄，蒜蓉虾滑等等，虽说是常见的摊位，但确别有一番风味。

老谢野馄饨。这边很多这种馄饨店，店里点一碗馄饨，再去点各种各样的烧烤，也算是一种奇妙的混搭。

一些韩式料理，精致，烤肉卷生菜加蒜瓣的味道很好。

还有特别的肘子店和台湾料理店小店，味道都是不错的。

最后是很出名的戳子肉，介于烧烤和铁板烧之间，还可以自己带料加工，用料十足，一群人晚上来吃吃喝喝真的很棒。

城市印象

我对青岛这个城市先入为主的抱有好感，一是姥姥在青岛生活过很长的时间，二是很小的时候也来过青岛旅游一次。因此自己对于整个山东地区都有一种比较好的印象。看着青岛那些像画一样的红色屋顶楼房，远远望去像是一副画一般，有些是历史的遗留，有些的风格的延续，它们共同构成了这美丽的城市。新鲜的海鲜，纯正的啤酒，时而温柔而时而肆虐的海风，都让这座城市有了自己的特点。而我和女票也在此留下了宝贵的回忆，那一张张照片，一次次记录，一顿顿美食，一个个风景，这些都是开阔眼界的证明。与读万卷书同样重要的是行万里路，希望以后还能有机会再回来多转转吧！

彩蛋：女票整理的青岛行程，真详细呀😋

毕业

Mon, 13 Jun 2022 12:05:04 GMT

当整理着自己一份又一份的毕业材料时，我终于明白，自己的求学生涯要迎来终点了。

望着桌面上的一堆文件，从小学到研究生，从6岁到25岁，将近20年的时光。象牙之塔的20年，听起来似乎十分漫长，但回首又是如此之短。形形色色的人物与景色像是从湖底冒出的巨大水泡，翻滚向上，越来越大，浮上心头，但最终又归于沉寂。

之前总是觉得以往的生活没有什么明确的分界线，一年又一年，但一年又如同上一年，仿佛有新意，但仿佛又是翻版。如果让我回忆求学生涯中有趣有印象的场景，小学可能是在小卖部买零食买卡牌的时光，初中可能是校门口买各种杂志的时光，高中可能是住校时大家打打闹闹踢足球的时光，大学可能是和朋友一起组乐队排练表演的时光，研究生可能是和同学一起吃好吃的时光。这段日子不可否认我学习到了很多东西，知识获得了增长，学历也在一步一步不停攀升，但是回首望去整个过往，又都是那么多平平淡淡。

学校生涯真的是太「无聊」了。日复一日的生活，学习，考试，学习，考试。我不喜欢这种方式，为什么我需要将花费可能几个月学习的知识，通过在规定时间内的一张考卷去证明学习的好坏。虽然听起来挺公平，但这实在是太笨蛋了。之前我只用好好学习就可以感觉还挺悠闲，但随着年龄愈大，我对这个流程愈加反感。可能在大学和研究生期间这个情况有所改善，但越是长大我越觉得十分的不合理。不过大学后的生活有闲，让我得以折腾很多其他东西，也确实从这些不断折腾中获得了不少的快乐。但是这又让我的生活与学习无法拥有一个明显的区分，研究生期间这种状况尤为严重，大家一天天的都在实验室从早到晚，就算是在休闲玩电脑也感觉到十分压抑，甚至还有种打卡上下班的感觉。从早做到晚，感觉做了什么，又好像什么东西都没有做。

找工作时放弃了找公务员这种类型的工作，一是觉得自己变得讨厌考试了，要叫我去考那些题目实际自己就做不出来。二是觉得这样的生活并不适合我，相较于安稳的度日，我更希望有挑战的人生，更准确的说是：没经历过的人生。一些有意思的事情，一些有意思的人，一些不一样的景色，一些不一样的任务，虽然过程可能会比较痛苦，但是可能收获更多的工作经验与人生阅历，开阔自己的眼界。虽然听长辈不断重复铁饭碗的种种安稳与利益。但现在的我仍然更渴望的是不安定与冲突。迄今为止的人生几次重大的升学都是在偶然中做出的选择。或许在未来的3年中，一定的波动与不确定会让我走的更远。

由于一些原因，有两份offer摆在我的面前，一份是北京的人工智能医疗公司的私企offer，一份是合肥中国银行软件研发中心的offer。北京的offer原本在合肥，属于科研岗，但是由于一些原因变动到了北京，离家较远。之前在里面实习过3个月，人员走走来来，充满了不确定性，但是比较对我的专业与兴趣。银行的offer稳定，但工作内容完全不知道需要重新学习，而且暂时还不知道薪资，但是胜在离家近。个人更偏向第一份offer，从兴趣的角度和眼界的角度会更和我的口味，还有一点就是相较于在家里吃住，我更希望能够自己生活一段时间去学习更多的生活技能。虽然在家里能够节省下住宿费和伙食费，但是一直在家里是无法长大的，人终究是要变得更加独立的。

毕业了，这真的是一个重大的转折了，25岁的我将脱离学校的怀抱，去真正的社会中探险。虽说眼前是一直的未知，但我还是会直面挑战。谢谢一路陪我走过的家人，谢谢辛苦把知识传授给我和具体独特人格魅力的老师们，谢谢一直有所联络的朋友们。也谢谢过去的自己，辛苦了，一个阶段结束了。然后，请继续加油吧。

乱谈府

RAG相关知识

RAG 定义

Basic idea

Indexing

Retrieval

Generation

Query Translation

Multi Query

RAG-Fusion

Decomposition

Step-back prompting

HyDE

Routing

Logitic routing

Semantic routing

Query Structuring

Indexing

Multi -representation

RAPTOR

ColBERT

Retrieval

Cohere ReRank

Corrective RAG

Embedding models

总结

其他参考

游戏 Animal Well

旅程——香港

DAY1 过关 然后落寞离场

DAY2 City Walk 累但挺开心

DAY3 香港海洋公园 进发

DAY4 尖沙咀美食探索 然后回程

香港的一点感想

电子化支付

交通趣闻

折叠屏Fold5双屏不同桌面方案

思路拆解

无ROOT解决方案

折叠情况

判断需要保持打开的APP

展开情况

小瑕疵

ROOT解决方案

Fold5简单使用体验

一场朋友的婚礼

2023年度总结

职业发展

财务状况

信息输出

自我实现

个人健康

家庭朋友

迪士尼之旅

电子漫画解决方案

在线漫画

本地漫画

本地阅读器

如何找到有趣的漫画

大众的热度漫画

特定类型的漫画

有趣的新连载

漫画与我

笔记螺旋上升

好记性不如烂笔头

器与术

我的笔记折腾经历

什么才是值得记录的

学习东西自己写的知识点的笔记

突然迸发思考而碎片化的想法

记录的一些流水账或统计

八三夭 live house

OpenCV高级操作

阈值处理

手动阈值 Basic thresholding

自动化阈值 OTSU

自适应阈值 adaptive thresholding

图像平滑和模糊

平均模糊 cv2.blur

高斯模糊 cv2.GaussianBlur

DAY1 过关然后落寞离场

DAY3 香港海洋公园进发

DAY4 尖沙咀美食探索然后回程

O1 职业发展精进技术，找新工作

O3 个人成长保持好奇心，输出分享

O4 自我实现新领域的探索永无止境