-
Embedding model이란 + CLIP, Stable diffusion2025.02.224
임베딩(Embedding)이란? 어떤 “이산적(discrete 구분되는)”인 객체(예: 단어, 문장, 이미지, 그래프 상의 노드 등)를 연속적인 벡터 공간으로 변환(매핑)하는 방법. 이산적인 데이터(예: ‘단어’, ‘문서’, ‘이미지’, ‘엔티티’)를 숫자 벡터로 표현해주기 때문에, 컴퓨터가 수학적으로 취급하거나 계산하기 쉬워짐. 이때 벡터 간의 거리나 방향을 통해 유사성, 문맥, 의미 관계 등을 어느 정도 추론할 수 있게 됨. * 이미지와 텍스트는 다른 종류의 정보지만, CLIP 모델 같은 것으로 동시에 학습 시킬 경우 벡터가 가까워 질 수 있음 "Embedding고차원 공간에서 단어나 이미지와 같은 데이터를 수학적으로 표현한 벡터뭉치. 데이터 처리 시 각 데이터에 일대일로 대응하는 벡터를 만들어 이..
CNN, Convolution, Kernel, Pooling 이미지들2024.09.256이런 그림들 너무 좋다..🥰 합성곱(合成-), 또는 콘벌루션(convolution)은 하나의 함수와 또 다른 함수를 반전 이동한 값을 곱한 다음, 구간에 대해 적분하여 새로운 함수를 구하는 수학 연산자 Pooling으로 Overfitting을 방지한다고 한다. 출처 : https://hobinjeong.medium.com/cnn%EC%97%90%EC%84%9C-pooling%EC%9D%B4%EB%9E%80-c4e01aa83c83 출처: https://brunch.co.kr/@gdhan/7 출처: https://www.analyticsvidhya.com/blog/2022/01/convolutional-neural-network-an-overview/..
PASCAL VOC(PASCAL Visual Object Classes Challenge)2024.03.17이미지 인식 Image recognition 나무라는 추상적인 개념 선택적 주의 집중 selective attention 문맥 context 종합적 이해 '픽셀을 읽어들여 어떻게 문맥 정보를 추출하고 이들을 어떻게 종합하여 이해할 것인가' '인간이 이미지를 인식하는 매커니즘을 밝혀내고, 이를 기계로 하여금 모방하도록 해 보자' 요인 Feature를 정의하여 사용하고, 이들을 종합하고 이해하도록 하기 위해 Learning model과 Learning algorithm을 사용하여 이를 머신 러닝 차원으로 해결하고자 하였다. 이런 이미지 인식 시도를 통해 자신감을 얻은 공학자들은, 기계의 이미지 인식 성능의 Benchmark로 삼을 수 있는 데이터셋들을 만들기 시작함. 그 중 초창기 이미지 인식 대회 중 가장..
Bounding box, Labeling 책갈피2024.02.23Roboflow https://blog.roboflow.com/how-to-draw-a-bounding-box-label-python/ How to Draw a Bounding Box Prediction Label with Python In this article, we show how to use the cv2 library to draw bounding box prediction labels in Python. blog.roboflow.com 자동 라벨링 및 딥러닝 플랫폼 서비스를 제공하는 곳임 ♣ Here is the code we'll need to draw our bounding boxes and add labels above each bounding box: import cv2 predicti..
YOLO 책갈피2024.02.13You Only Look Once — 다.. 단지 한 번만 보았을 뿐이라구! 이번 포스팅에서는 객체 탐지(Object Detection)분야에서 많이 알려진 논문인 “You Only Look Once: Unified, Real-Time Object Detection (2016)”을 다룬다[1]. 줄여서 흔히 YOLO라고… medium.com Machine Learning / Yolo3 카테고리가 있는 블로그 https://ctkim.tistory.com/entry/YOLOYou-Only-Look-Once YOLO(You Only Look Once)란? ☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시..
데이터 과학 플랫폼들 (링크)2024.02.132사이트 구경만 해도 신기하다ㅎㅎ 약간 멋지고 비싼 가구 전시장에서 구경하는 기분 Azure Machine Learning 마이크로소프트 애저 머신러닝 https://azure.microsoft.com/ko-kr/products/machine-learning Azure Machine Learning - ML as a Service | Microsoft Azure Azure에서 기계 학습 플랫폼을 사용하여 간소화된 방법으로 기계 학습 모델을 빌드하세요. MLaaS(Machine Learning as a Service)를 사용하면 접근성 및 효율성이 향상됩니다. azure.microsoft.com SAS Viya SAS 바이야 https://www.sas.com/ko_kr/software/viya.html S..
OpenCV 살짝..2024.02.05Computer Vision 및 기계 학습과 관련된 다양한 알고리즘을 지원하는 오픈 소스 라이브러리. 2000년 출시. (1999년 Gary Bradsky, Intel + Vadim Pisarevsky + Willow Garage 지원) https://docs.opencv.org/4.x/d0/de3/tutorial_py_intro.html OpenCV: Introduction to OpenCV-Python Tutorials OpenCV OpenCV was started at Intel in 1999 by Gary Bradsky, and the first release came out in 2000. Vadim Pisarevsky joined Gary Bradsky to manage Intel's Russ..
Computer vision libraries / 작성 중2024.02.016OpenCV (Open Source Computer Vision Library) C++, Python, Java 등 다양한 언어에서 사용 가능한 가장 널리 사용되는 오픈소스 머신 비전 라이브러리 중 하나. 이미지 및 비디오 처리, 객체 감지, 얼굴 인식, 기계 학습 등 다양한 기능 제공. https://opencv.org/ Home OpenCV provides a real-time optimized Computer Vision library, tools, and hardware. It also supports model execution for Machine Learning (ML) and Artificial Intelligence (AI). opencv.org https://pypi.org/projec..
데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어2024.01.31데이터 분석가(애널리스트) - 데이터 분석, 처리 및 비즈니스에 유의미한 결과 창출 - 분석 도구를 활용해서 데이터 보고서 설계 및 작성 프로모션 KPI 수립, 비즈니스 의사결정에 필요한 데이터 분석 업무 도메인 지식 매우 중요함 문제 제대로 파악해야 함 어떤 데이터가 필요할 지 정의 데이터를 분석, 개선안 마련해야 함 데이터 시각화, 커뮤니케이션 능력 매우 중요 데이터시각화 Tool: Power BI, Tableau, Google Analytics 데이터 분석 가공 업무를 위한 SQL, Python, R 등의 언어로 프로그래밍 학습 필요함 데이터 사이언티스트 - 과거 패턴으로부터 미래 예측 - 비즈니스에 여러 알고리즘 적용시켜 새로운 분석 모델 및 머신러닝 모델 수정/개발 특정 비즈니스 도메인 안에서 ..
데이터 마이닝 Data Mining2024.01.113Data Mining 데이터 마이닝 (두산) 많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다. 데이터베이스로부터 과거에는 알지 못했지만 데이터 속에서 유도된 새로운 데이터 모델을 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 광맥을 찾아내듯이 정보를 발견해 내는 것이다. 여기에서 정보 발견이란 데이터에 고급 통계 분석과 모델링 기법을 적용하여 유용한 패턴과 관계를 찾아내는 과정이다. 데이터베이스 마케팅의 핵심 기술이라고 할 수 있다. 예를 들어, 한 백화점에서 판매 데이터베이스의 데이터를 분석하여 금요일 오전에는 어떤 상품들이 잘 팔리는..
Data analysis, Data mining, DataOps, EDA, CDA2023.05.29Data analysis 데이터 분석 어떤 기존 시스템 또는 계획 중인 시스템에서 데이터와 데이터의 흐름을 체계적으로 조사하는 것. 출처: 네이버 지식백과 / IT용어사전 Data mining 데이터 마이닝 대용량 데이터에서 의미 있는 통계적 패턴이나 규칙, 관계를 찾아내 분석하여 유용하고 활용할수 있는 정보를 추출하는 기술 지하에 묻힌 광물을 찾아낸다는 뜻의 마이닝(mining)은 탄광에서 석탄을 캐거나 대륙붕에서 원유를 채굴하는 작업처럼 데이터에서 숨겨진 가치를 찾아낸다는 의미에서 데이터 분석 용어로 사용한다. 데이터 마이닝은 학문적으로는 통계, 전산, 경영 등 다양한 데이터 분석 관련 학문의 융합으로 탄생한 융합 학문이다. 기술적으로 데이터 마이닝에는 대용량 데이터를 효율적으로 저장하고 관리하는 기..