주제: Generative AI를 사용해서 데이터를 늘리고, 정확도 손실 문제(Generative AI를 적용하는 과정에서 얻게 되는)를 pruning, Quantization 등의 방법으로 해결
논문 분석: 생성형 AI로 인한 정확도 손실 문제, Generative AI의 data augmentation 방법이 연구된 논문 분석
Generative AI: 비정형 딥 러닝 모델을 사용하여 사용자 입력을 기반으로, 결과를 능동적으로 생성하는 인공지능 기술
대표적인 예시: OpenAI의 GPT
대표적인 알고리즘: GAN (Generative Adversarial Networks), VAE(Variational Autoencoder)
Sample Augmentation for Intelligent Milling Tool Wear Condition Monitoring Using Numerical Simulation and Generative Adversarial Network [수치 시뮬레이션과 생성적 적대관계망을 이용한 지능형 밀링툴 마모상태 모니터링을 위한 표본증강]
수치 시뮬레이션과 GAN에 기초한 새로운 데이터 증강 방법을 제안
→ 밀링 TCM 애플리케이션에서 AI 분류기를 훈련하는 데 사용된 데이터 세트와 관련된 누락 샘플 및 샘플 부족의 중요한 문제를 다룸
실험
데이터셋 수집 - J-C 모델을 기반으로 시뮬레이션된 변형 가능한 공작물이 있는 FEM 모델을 사용한 시뮬레이션이 아니라 공구 마모 조건과 관련된 수치 신호 샘플을 통해 얻어집니다.
GAN → 시뮬레이션된 샘플& 실험 통해 측정된 샘플과 유사한 추가 샘플을 합성하는데 사용
** GAN(Generative Adversarial Network)
훈련 과정 동안 반대되는 작업을 수행하는 생성기(G)와 판별기(D)로 구성
GAN에는 생성과 판별의 두 단계 존재
생성 단계에서 G는 가우시안 분포와 같은 이전 잡음 분포 z에 매핑하여 새로운 후보 데이터 샘플을 생성하고, 그 목표는 D에 의해 진짜라고 간주되는 잘못된 데이터 샘플 G(z)를 생성하는 것입니다. (최소화)
판별 단계에서 D는 입력 G(z)가 생성된 데이터 대신 실제 데이터에서 나올 확률 D(G(z))를 추정합니다. D(G(z))가 1에 가까울수록 더 높음을 의미합니다
훈련 과정은 G와 D에 대해 교대로 진행
G가 고정된 상태에서 D의 목적 함수를 최대화하여 D를 업데이트합니다.
D의 최적 해:
G의 목적함수를 최소화하여 D를 고정하고 G를 갱신하며, 상기 과정은 G와 D가 내쉬 균형에 도달할 때까지 반복되며, 이를 통해 훈련과정이 종료됨.
판별기 D는 훈련 초기에 실제 데이터로부터 학습할 수 있도록 허용되어 입력 샘플이 실제 샘플이라는 것을 인식할 수 있는 일차적인 용량을 가지며, 이후 판별기 D와 생성기 G가 교대로 훈련되어 서로 경쟁합니다.
→ GAN을 사용하여 많은 새로운 유사한 샘플이 생성
→ 원래 샘플과 결합된 합성 샘플을 얻을 수 있다.
실험결과
Data Augmentation using Generative Adversarial Neural Networks of Brain Structural Connectivity in Multiple Sclerosis[다발성 경화증에서 뇌 구조적 연결성의 AAE을 이용한 데이터 증강]
기여점
본 연구에서는 다중 경화증(MS)에서 합성 구조적 뇌 네트워크를 만들기 위해 GAN 기반한 프레임워크를 제안
데이터 셋
29명의 재발송신과 19명의 2차 진행형 MS 환자로 구성
각 피험자에 대한 구조적 뇌 네트워크를 얻기 위해 T1 및 확산 텐서 이미징(DTI) 획득 사용
실험:
Generative Adversarial Neural Network AutoEncoder (AAE)
→제안된 AAE 모델의 개략적인 표현.
뇌 커넥톰 데이터 표현(인접 행렬)으로부터 시작하여 조건부 확률 분포가 계산 → 이로부터 커넥톰 데이터의 새로운 배치가 샘플링
샘플링된 인접 행렬의 벡터화된 표현으로부터
인코더 네트워크는 입력을 잠재적 하위 차원 표현으로 압축
디코더 네트워크는 압축된 잠재 표현으로부터 입력을 재구성
**자동 인코더 생성기
판별기 네트워크는 잠재 표현과 무작위 노이즈 벡터를 입력으로 취하고 둘을 구별하여 효과적으로 자동 인코더의 잠재 분포에 제약을 가합니다.
마지막으로 잠재 공간으로부터 추가 분류기가 RRMS와 SPMS 환자를 구별합니다.
결과: 제안 모델이 구조적 뇌 네트워크에 직접 적용될 수 있음을 보임.
정량적 및 정성적으로 새로 생성된 데이터가 실제 데이터와 비교하여 상당한 차이를 나타내지 않음을 증명
생성된 샘플로 기존 데이터 세트를 증강하면 기본 접근 방식(≥1 ≥ 66%)과 관련하여 분류 성능(≥1 ≥ 81%)이 향상됩니다.
제안 모델: VAE(Variational Autoencoder)를 기반으로 자율 주행 대중 교통에 대한 이상 감지 모델을 제안
T. Wang, M. Qiao, Z. Lin, C.e. Li, H. Snoussi, Z. Liu, C. Choi Generative Neural Networks for Anomaly Detection in Crowded Scenes
배경: 보안 감시는 사회적 화합과 사람들의 평화로운 삶에 매우 중요합니다. 사회적 안정과 생명 보호 강화에 큰 영향을 미칩니다. 비디오 감시에서 이상 징후를 적시에 효과적이고 효율적으로 탐지하는 것은 여전히 어려운 과제입니다
제안모델: VAE 활용하여 이상탐지
**Variational Autoencoder(VAE) 자동 인코더 생성기