본문 바로가기
728x90
반응형

강의 (Lecture)23

Stable Diffusion XL 이란? 사용법이나 이전 모델과의 차이 안녕하세요. 코딩산책입니다.Stable Diffusion XL은 Stability AI 사가 개발한 Stable Diffusion의 최신 모델로 SDXL로 약칭됩니다. 2023년 7월에 정식판 SDXL1.0, 그 후, 11월에는 SDXL Turbo가 발표되었습니다. 이 포스트에서는 Stable Diffusion XL의 세부 사항과 사용법을 소개합니다. Stable Diffusion XL 이란?Stable Diffusion XL(SDXL)은 Stability AI사에 의해 개발되어 오픈 소스화된 이미지 생성 AI의 최신 모델(2024년 4월 시점)입니다. 이전 모델보다 정밀도가 높고 다양한 스타일의 이미지를 생성할 수 있습니다.Stable Diffusion XL 과 이전 모델의 차이Stable Diffus.. 2024. 11. 11.
[Stable Diffusion Web UI] ControlNet의 사용법 안녕하세요. 코딩산책입니다.ControlNet은 Stable Diffusion Web UI의 확장 기능 중 하나로 생성되는 이미지를 제어할 수 있습니다. 이 포스트에서는 Stable Diffusion Web UI에서 ContorlNet을 설치하는 방법을 요약합니다. 아울러 ControlNet의 모델의 하나인 Canny에 대해 소개합니다. ControlNet 이란?ControlNet은 Stable Diffusion 모델에서 입력 이미지의 세부 사항을 더 정밀하게 제어할 수 있도록 도와주는 확장 기능입니다. 일반적인 Text-to-Image 모델은 텍스트 프롬프트를 입력으로 받지만, ControlNet을 사용하면 텍스트 프롬프트 외에도 스케치, 윤곽선, 포즈, 에지(edge) 등 다양한 추가 이미지 정보를 .. 2024. 11. 7.
[Stable Diffusion Web UI] 모델 사용 방법 (Checkpoint) 안녕하세요. 코딩산책입니다. 모델이란?Stable Diffusion WebUI는 미리 설정한 모델에서 프롬프트에 맞게 이미지를 생성합니다. 모델에 따라 실사풍, 애니메이션, 유화 등 다양한 특징이 있으며, 생성되는 이미지의 분위기와 스타일, 화풍에 영향을줍니다. 생성하고자 하는 이미지에 가까운 모델을 사용하면, 예상한 이미지에 가까운 이미지를 생성할 수 있습니다. 모델 (Checkpoint)와 LoRA의 차이Stable Diffusion Web UI에서는 "Checkpoint"와 "LoRA"라는 용어가 자주 사용됩니다.Checkpoint는 모델 파일의 기본으로 사용되는 본체가 됩니다. LoRA는 Checkpoint 모델에 추가적인 데이터셋으로 특정한 도메인에 특화되어 적응되도록 추가로 학습된 모델 파일을.. 2024. 11. 6.
[AUTOMATIC1111] Windows에 설치하는 방법 안녕하세요. 코딩산책입니다. Stable Diffusion 이란?Stable Diffusion은 무료로 사용할 수 있는 이미지 생성 AI입니다. 프롬프트를 입력하면 해당 이미지가 생성되는 방식입니다. 사람, 동물, 풍경 등 다양한 이미지를 생성할 수 있습니다.예를 들어 "cat wearing sunglasses"를 입력하면 아래와 같은 이미지가 생성됩니다. 생성하는 이미지의 스타일도 다양하고 일러스트와 사진, 수채화와 애니메이션 톤 등 자신이 좋아하는 테마로 생성할 수 있습니다. Stable Diffusion WebUI (AUTOMATIC1111) 란?Stable Diffusion WebUI(AUTOMATIC1111)는 브라우저를 통해 손쉽게 이미지 생성을 할 수 있는 무료 웹 애플리케이션으로 구글 크.. 2024. 11. 5.
[SwarmUI] Windows에 설치하는 방법 안녕하세요. 코딩산책입니다. Stable Diffusion 이란?Stable Diffusion은 무료로 사용할 수 있는 이미지 생성 AI입니다. 프롬프트를 입력하면 해당 이미지가 생성되는 방식입니다. 사람, 동물, 풍경 등 다양한 이미지를 생성할 수 있습니다.예를 들어 "cat wearing sunglasses"를 입력하면 아래와 같은 이미지가 생성됩니다. 생성하는 이미지의 스타일도 다양하게 변형하여 얻을 수 있고, 일러스트와 사진, 수채화와 애니메이션 톤 등 자신이 좋아하는 테마로 생성할 수 있습니다. Stable Diffusion WebUI (SwarmUI) 란?Stable Diffusion WebUI(SwarmUI)는 브라우저를 통해 손쉽게 이미지 생성을 할 수 있는 Stability-AI에서 제.. 2024. 11. 4.
OpenCV + Python 외곽선 검출과 레이블링(labeling) - 2 안녕하세요. 코딩산책입니다.이 글에서는 지난 글에 이어서 작성 해보도록 하겠습니다. OpenCV + Python 외곽선 검출과 레이블링(labeling) - 1안녕하세요. 코딩산책입니다.컴퓨터 비전 분야에서 외곽선 검출과 레이블링은 이미지 분석과 객체 인식에 있어 핵심적인 기술입니다. 이 두 가지 기술을 사용하면 이미지에서 객체의 경계와codingwalks.com 6.외곽선 검출의 실제 응용: 객체 추적외곽선 검출 기술은 단순한 경계선 탐지에서 나아가, 다양한 실제 응용 사례에 사용됩니다. 그중에서도 대표적인 분야가 객체 추적(Object Tracking)입니다. 외곽선을 이용하여 물체를 감지하고, 해당 물체가 움직이는 동안 그 궤적을 추적하는 방식은 비전 시스템에서 흔히 쓰입니다.객체 추적의 기본 개념.. 2024. 10. 30.
OpenCV + Python 외곽선 검출과 레이블링(labeling) - 1 안녕하세요. 코딩산책입니다.컴퓨터 비전 분야에서 외곽선 검출과 레이블링은 이미지 분석과 객체 인식에 있어 핵심적인 기술입니다. 이 두 가지 기술을 사용하면 이미지에서 객체의 경계와 형태를 추출하고, 각 객체를 구분하여 분석할 수 있습니다. 특히, OpenCV와 Python을 활용한 외곽선 검출은 다양한 산업과 연구 분야에서 폭넓게 사용되고 있으며, 이를 통해 자동화된 시스템이 보다 정확하고 효율적으로 동작할 수 있습니다.이 글에서는 cv2.findContours, cv2.approxPolyDP, cv2.convexHull, cv2.moments 등의 OpenCV 함수들을 통해 외곽선 검출과 레이블링 기법을 자세히 설명합니다. 또한, 실제 활용 사례와 이러한 기법의 한계 및 개선점을 다루어, 외곽선 검출 .. 2024. 10. 30.
OpenCV + Python 모폴로지 (Morphology) 안녕하세요. 코딩산책입니다.이미지 처리는 다양한 분야에서 중요한 역할을 하고 있으며, 그중에서도 모폴로지 연산과 워터쉐드 알고리즘은 이미지의 구조적 특성을 분석하고 객체를 분리하는 데 매우 유용한 기법입니다. 모폴로지 연산은 객체의 형상을 조정하고, 객체 간 경계를 구분하며, 이미지 노이즈를 제거하는 데 사용됩니다. 이 글에서는 침식(Erosion), 팽창(Dilation), 열기(Opening), 닫기(Closing), 그레이디언트(Gradient)와 같은 모폴로지 연산과 워터쉐드 알고리즘의 이론적 배경과 함께 Python과 OpenCV를 이용한 실제 코드 예제를 다룹니다. 이 연산들은 특히 동전 분류나 지문 융선 검출과 같은 응용 사례에서 큰 효과를 발휘합니다. 1. 모폴로지(Morphology) 란.. 2024. 10. 25.
OpenCV + Python 이진화 (임계처리) 안녕하세요. 코딩산책입니다.이미지 이진화(Thresholding)는 이미지 처리에서 중요한 기술 중 하나로, 픽셀 값을 흑백 두 가지 값으로 변환하여 불필요한 정보를 제거하고 핵심 부분만 추출하는 데 사용됩니다. 이진화는 노이즈 제거, 객체 검출, 경계 추출 등 다양한 문제 해결에 유용합니다. 이번 글에서는 OpenCV를 활용해 Python에서 다양한 이진화 기법을 사용하는 방법을 살펴보겠습니다. 기본적인 cv2.threshold 함수부터 Otsu 이진화, 적응형 이진화 기법까지, 실제 예제를 통해 알아보겠습니다. 1. 기본 이진화 (cv2.threshold)cv2.threshold는 이미지 이진화의 기본 함수로, 고정된 임계값을 사용해 픽셀 값을 흑백으로 변환합니다. 이 함수는 다양한 파라미터와 이진화.. 2024. 10. 22.
728x90
반응형