Reflections on Researches

2 minute read

Published: April 07, 2023

A general overview of papers read recently, and a reflection on what we have done and what to do next.

端到端的医学影像重建 (Compton/PET)
- GAN
- Flow
- UNet
- 问题
Object Localization
- WSOL: 弱监督目标定位
Causal Inference: 因果推断
GCN 图卷积神经网络

端到端的医学影像重建 (Compton/PET)

GAN

Shen, G., Dwivedi, K., Majima, K., Horikawa, T., & Kamitani, Y. (2019). End-to-end deep image reconstruction from human brain activity. Frontiers in computational neuroscience, 13, 21

Flow

RealNVP: Hajij, M., Zamzmi, G., Paul, R., & Thukar, L. (2022, March). Normalizing Flow for Synthetic Medical Images Generation. In 2022 IEEE Healthcare Innovations and Point of Care Technologies (HI-POCT) (pp. 46-49). IEEE.

UNet

Zhao, R., Zhang, Y., Yaman, B., Lungren, M. P., & Hansen, M. S. (2021). End-to-end AI-based MRI reconstruction and lesion detection pipeline for evaluation of deep learning image reconstruction. arXiv preprint arXiv:2109.11524.

问题

多数end-to-end是从sinogram (projection domain) 映射变换到重建图像 (image domain)，而Compton没有sinogram，且sinogram的引入会带来误差
受限于ground truth成像质量，ground truth成像质量即其理论上界；产生高质量的ground truth、标注数据也会带来较大的时间代价
如果辐射源不是点，而是面，那么这种条件下的“定位”，似乎跟图像重建没有区别
如果从list mode数据出发，模型重建图像的可解释性？

Object Localization

WSOL: 弱监督目标定位

什么是WSOL

从image-level annotation出发，对目标进行定位

图像级标注 image-level annotation

仅标注图像中相关物体所属的类别，是最简单的标注

基于图像级标注，WSOL旨在给出带预测图像中包含主体的类别以及位置（bounding box）

通常思路: CAM

CAM，即Class Activation Map。通常模型首先生成CAM，然后分割出激活值最高的区域作为一个粗糙的定位结果。

CI-CAM

[[CI-CAM]]是基于因果推断的CAM模型。主要解决在定位问题中，受到背景信息$C$纠缠从而使输入$X$和目标$Y$之间存在虚假相关性的问题

Shao, F., Luo, Y., Zhang, L., Ye, L., Tang, S., Yang, Y., & Xiao, J. (2021, October). Improving Weakly Supervised Object Localization via Causal Intervention. In Proceedings of the 29th ACM International Conference on Multimedia (pp. 3321-3329).

Causal Inference: 因果推断

新坑，待填

GCN 图卷积神经网络

对每个事件，absorber和scatterer上的两个响应位置，再加上source location可以构成子图。事件累积，也即子图累积，最终形成一个图。理想情况下，该图具有以下特点

source location是一个关键点，连接所有子图
该图不同于一般的抽象图，具有固定的几何构型（边长+角度），不可变形
- 所以理论上图同构没有意义
单向图：只有scatter指向absorber的边
重边：相同的一组scatter和absorber可能重复形成event

数据集组织

如果不考虑event的先后顺序

建立邻接矩阵$E_{adj}[21][21][3]$：每个邻接矩阵放21个events的feature
- axis=0：absorber对应的scatterer
- axis=1：$E_{1}$
- axis=2：$E_{2}$
保留响应点的几何特征：$(x_{1}, y_{1}, z_{1}), (x_{2}, y_{2}, z_{2})$

可以通过预测需要的邻接矩阵个数来判断数据量上的开销是否同时需要$E_{1}$和$E_{2}$有待测试；可以只保留保留$E_{1}$，或者另一个换成$511-E_{1}$

To Start with: GraphSAGE

GraphSAGE针对之前的网络表示学习的transductive的问题，提出了一个inductive的GraphSAGE算法；同时利用节点特征信息和结构信息得到Graph Embedding的映射。相比之前的方法，之前都是保存了映射后的结果，而GraphSAGE保存了生成embedding的映射，可扩展性更强，对于节点分类和链接预测问题的表现也比较突出

Share on

Twitter Facebook LinkedIn

Haoyu Lu

Reflections on Researches

端到端的医学影像重建 (Compton/PET)

GAN

Flow

UNet

问题

Object Localization

WSOL: 弱监督目标定位

什么是WSOL

图像级标注 image-level annotation

通常思路: CAM

CI-CAM

Causal Inference: 因果推断

GCN 图卷积神经网络

相关应用

Conformation Generation

GraphNet

Point-GNN

Track Reconstruction

Interaction Network

数据集组织

To Start with: GraphSAGE

Share on

You May Also Enjoy

DeepONet and Operator Learning

LCA-on-the-Line Explained

DDPO: Aligning Diffusion Models with Human Preferences via Reinforcement Learning

Radiative Transfer Equation