Google Whisk 훑어보기
Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...
Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...
🔍 Data Formulator 2란? Data Formulator 2는 AI를 활용하여 데이터 변환과 시각화 과정을 자동화하고 최적화하는 최신 데이터 분석 도구입니다. 기존 데이터 시각화 툴과 달리 사용자 인터페이스(UI)와 자연어 입력(NL)을 결합하여 보다 직관적인 데이터 분석 환경을 제공합니다. 특히, 반복적인 데이터 변환과 차트 생성이 필요한...
논문: InternVideo: General Video Foundation Models via Generative and Discriminative Learning GitHub: InternVideo 공식 저장소 Papers with Code Benchmarks: Kinetics-400 Something-Somet...
논문: End-to-End Semi-Supervised Object Detection with Soft Teacher GitHub 코드: SoftTeacher 공식 저장소 Papers with Code Benchmarks: COCO 1% COCO 5% COCO 10% ...
논문: HunyuanVideo: A Systematic Framework for Large Video Generative Models GitHub: https://github.com/Tencent/HunyuanVideo Demo: HunyuanVideo Playground Hugging Face 모델: HunyuanVideo on Huggi...
논문: LLMs can see and hear without any training Github: https://github.com/facebookresearch/MILS 🔍 MILS란? MILS (Multimodal Iterative LLM Solver)은 추가 학습 없이 대형 언어 모델(LLM)을 활용하여 이미지, 비디오, 오디오 캡션 ...
논문: MoAI: Mixture of All Intelligence for Large Language and Vision Models Github: https://github.com/ByungKwanLee/MoAI 🔍 MoAI란? MoAI(Mixture of All Intelligence)는 기존 LLVM(Large Language an...
Paper: DEIM: DETR with Improved Matching for Fast Convergence Github: https://github.com/ShihuaHuang95/DEIM 🔍 DEIM이란? DEIM(DETR with Improved Matching for Fast Convergence)은 DETR 기반 객체 탐지 모델의...
2025년, AI 혁신의 판도를 바꿀 TOP 3 기술 — 에이전트 AI, 멀티모달 AI, 그리고 설명 가능한 AI — 안녕하세요, 여러분. 오늘은 제가 2025년을 맞이하며 주목해야 할 AI 기술 TOP 3에 대해 제 생각을 정리해 보았습니다. 이 글은 AI에 익숙하지 않은 분들도 쉽게 이해할 수 있도록 기본 개념부터 실제 활용 사례까지 자세히 설...
LLaVA: https://github.com/haotian-liu/LLaVA LLaVA Page: https://llava-vl.github.io/ LLaVA NeXT: https://github.com/LLaVA-VL/LLaVA-NeXT/ LLaVA Plus: https://github.com/LLaVA-VL/LLaVA-Plus-Code...