돌아가기 AI 정보
Qwen-Image-Edit 종합 분석: 이중 언어 단어 변경이 더 정확해지고 의미론/모양 수준 편집이 원스톱으로 이루어집니다.

Qwen-Image-Edit 종합 분석: 이중 언어 단어 변경이 더 정확해지고 의미론/모양 수준 편집이 원스톱으로 이루어집니다.

AI 정보 Admin 9 회 조회

Qwen-Image-Edit 출시: 20B 기본, 이중 언어 이중 언어 정확한 단어 변경 및 의미/모양 수준 이미지 편집에 대한 전체 분석. Qwen-Image-Edit는 20B 스케일 Qwen-Image 받침대에서 출시된 이미지 편집 모델입니다. 이 모델은 중국어와 영어로 정밀한 텍스트 편집을 지원하며 원래 글꼴과 레이아웃을 유지하면서 "추가, 삭제 및 수정"을 강조합니다. 이 모델은 의미 수준 편집(예: 객체 회전, 스타일 전송 및 IP 연속 생성)과 모양 수준 편집(예: 객체 추가/삭제/수정, 색상 변경, 배경 변경 및 세부 복구)을 모두 지원하며 온라인 경험, 오픈 소스 가중치 및 클라우드 API 액세스를 제공합니다.


1. 핵심 기능

1) 이중 언어 텍스트 편집: 이미지의 중국어 및 영어 텍스트 추가, 삭제 및 교체를 지원하고 원본 글꼴, 글꼴 크기 및 스타일을 일관되게 유지하려고 노력합니다.

2) 시맨틱 수준 편집: 객체 90°/180° 원근 회전, 스타일 전송, 문자 일관성 및 IP 연속 생성을 지원하여 시맨틱이 전체 스타일과 일관성을 유지한다는 점을 강조합니다.

3) 외모 수준 편집: 관련 없는 영역은 변경하지 않고 추가/삭제/수정, 색상 변경, 배경 변경, 잔해 제거 및 세부 사항 복구를 지원합니다.

4) 파이프라인 아이디어(공식 자료에 따름): 입력 이미지는 "콘텐츠 일관성"과 "픽셀 충실도"의 균형을 맞추기 위해 시각적 의미 제어 및 모양 재구성 채널에 동시에 공급됩니다.

5) 생태학적 무결성: 웹 경험, 오픈 소스 모델 및 추론 예제, 프로덕션 지향 클라우드 API를 제공합니다.


2. 적용 가능한 시나리오

  • 전자 상거래/브랜드: 포스터 오타의 직접 수정, 언어 간 현지화 및 홍보 포스터의 신속한 업데이트.
  • 소셜 미디어/짧은 동영상: 스타일 마이그레이션, 이모티콘 및 아바타 일괄 생성.
  • 그래픽 디자인: 간판은 사실적인 반사를 추가 및 생성하고, 잔해물을 제거하고, 지역 세부 사항을 복구합니다.
  • 포스트 이미지 단계: 캐릭터 드레싱, 배경 변경, 자세 및 원근 조정.


3. 빠른 시작(온라인 및 로컬)

1) 온라인 경험: 공식 채팅 포털에서 "이미지 편집"을 선택하고 이미지를 업로드한 후 수정 요구 사항을 중국어와 영어로 설명하여 결과를 생성합니다.

2) Hugging Face Inference: GPU 환경에서 가중치를 로드하고, 이미지 + 프롬프트를 입력하고, 단계, 랜덤 시드, 네거티브 프롬프트 등의 파라미터를 구성할 수 있는 QwenImageEditPipeline의 로컬 추론 예제를 제공합니다.

3) ModelScope: 모델 페이지와 체험 입구를 동시에 제공하여 국내 네트워크 환경에서 접속 및 다운로드가 편리합니다.


4. Alibaba Cloud Model Studio API 액세스 포인트

  • 모델 이름: qwen-image-edit.
  • 인터페이스 경로: 국제역의 HTTP 인터페이스는 JSON 요청 본문과 Bearer API 키 인증을 사용하여 멀티모달 생성 서비스를 지원합니다.
  • 입력 구조: input.messages[0].content에는 {"image": "<URL 또는 Base64>"}{"text": "< 중국어 및 영어 프롬프트>"}가 포함되어 있습니다.
  • 필드 제약 조건: 앞으로 프롬프트 텍스트의 길이는 최대 약 800자입니다. 부정적인 프롬프트는 최대 약 500자negative_prompt 됩니다. prompt_extend의 지능적인 재작성을 활성화합니다. 워터마크는 오른쪽 하단 모서리에 있는 "Qwen-Image" 워터마크 스위치를 제어합니다.
  • 이미지 제한: JPG/JPEG/PNG/BMP/TIFF/WEBP; 너비 및 높이 512–4096; 단일 이미지 ≤10MB; URL에는 중국어가 포함되어서는 안 됩니다. 결과 링크는 24시간 동안 유효합니다.
  • 청구 및 한도(싱가포르): 그래프당 약 $0.045; 100 무료 크레딧(활성화 후 180일 동안 유효); 커밋 RPS=5, 동시성=2.
  • 반환 결과: 출력은 이미지 링크가 있는 구조화된 결과입니다. 비즈니스 측이 구현된 직후 자신의 스토리지를 다운로드하여 이전하는 것이 좋습니다.


5. 실제 운영 및 워크플로우 제안

1) 체인 편집이 더 안정적입니다: 복잡한 대상을 다단계 미세 조정(프레임 선택, 단어별/영역별 수정)으로 분해하고 점차적으로 원하는 효과로 수렴합니다.

2) 지역화 제어 우선순위: 모양 수준 수정의 경우 먼저 수정이 필요하거나 변경되지 않은 상태로 유지하여 관련 없는 픽셀 드리프트를 줄입니다.

3) 프롬프트 단어는 검증 가능해야 합니다: 명확한 개체, 위치, 색상, 수량 및 스타일; 필요한 경우 부정적인 프롬프트에 협력하여 원치 않는 요소를 제거하십시오.

4) 캐싱 및 내결함성: 클라우드 결과 링크의 적시성이 제한되어 있으므로 다운로드 및 캐싱 정책은 객체 스토리지, 화이트리스트 및 재시도 대기열과 함께 설계해야 합니다.

5) 팀 협업: "텍스트 편집", "의미 편집" 및 "모양 편집"은 작업 및 디자인의 재사용을 용이하게 하기 위해 서로 다른 템플릿으로 나뉩니다.


6. 비교 및 포지셔닝(공식 및 커뮤니티 자료에 따름)

  • 중국어 텍스트 편집 친화적: 작은 중국어 글꼴 크기와 복잡한 조판 시나리오에서 모양을 유지하는 강력한 능력을 가지고 있습니다.
  • 의미론 + 외관 이중 제어 아이디어: "내용 일관성"과 "지역 불변성"을 동시에 주시하여 스타일 드리프트의 위험을 줄입니다.
  • 생태학적 적용 범위: 웹 페이지 데모, 오픈 소스 가중치 및 엔터프라이즈급 API가 병렬로 실행되어 경험에서 구현까지의 경로를 단축합니다.


7. 한계 및 위험 경고

  • 벤치마크 결과와 "SOTA" 표현은 공식 자료에서 가져온 것이며 실제 비즈니스는 자체 샘플에서 검증되어야 합니다.
  • 단적인 시나리오(초소형 글꼴 크기, 강한 원근감/반사, 복잡한 배경)는 실패할 수 있으며 여러 체인 미세 조정이 필요할 수 있습니다.
  • 상표, 초상화, 특정 스타일, IP의 경우 저작권 및 플랫폼 사양을 준수해야 합니다.


Q&A FAQ

Q: Qwen-Image-Edit는 어떤 핵심 문제를 해결합니까?

A: Qwen-Image-Edit는 이미지에서 중국어 및 영어 "단어 변경"의 가용성 문제를 해결하고 의미론적 편집과 모양 편집 사이의 균형을 달성합니다.

Q: 온라인으로 경험하는 방법은 무엇입니까?

A: 공식 채팅 포털에서 "이미지 편집"을 선택하고 이미지를 업로드한 후 중국어와 영어로 수정 지침을 입력하면 체험이 시작됩니다.

질문: 로컬 추론은 어떤가요?

A: Hugging Face에 QwenImageEditPipeline을 로드하고 이미지 + 프롬프트를 입력한 다음 단계, 부정 프롬프트, 무작위 시드 등과 같은 매개변수를 구성합니다.

Q: 클라우드 API의 주요 매개변수는 무엇입니까?

A: 메시지에 model=qwen-image-edit, imagetext 제공해야 합니다. 옵션 negative_prompt, prompt_extend, 워터마크; 이미지는 형식, 크기 및 크기 제한을 충족해야 합니다.

Q: 가격과 할당량은 어떻게 계산되나요?

A: 싱가포르의 가격은 차트당 약 $0.045입니다. 100 무료 크레딧(활성화 후 180일 동안 유효); 커밋 RPS=5, 동시성=2.

Q: 링크가 만료되는 이유는 무엇입니까?

A: 클라우드에서 반환된 이미지 링크는 24시간 동안 유효하며 가능한 한 빨리 다운로드하여 자신의 저장소로 전송해야 합니다.


참고문헌

공식 블로그(영어/중국어 번역): https://qwenlm.github.io/blog/qwen-image-edit/

Hugging Face 모델 카드(QwenImageEditPipeline 샘플 및 라이선스 포함): https://huggingface.co/Qwen/Qwen-Image-Edit

Hugging Face 온라인 데모(공간): https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

Alibaba Cloud Model Studio · qwen-image-edit (API / 가격 / 매개 변수 / 예제) : https://www.alibabacloud.com/help/en/model-studio/qwen-image-edit

Qwen 채팅: https://chat.qwen.ai/?inputFeature=image_edit

GitHub · Qwen-Image 저장소(Apache-2.0): https://github.com/QwenLM/Qwen-Image

Qwen-Image 기술 보고서(arXiv): https://arxiv.org/abs/2508.02324

ModelScope 모델 페이지: https://modelscope.cn/models/Qwen/Qwen-Image-Edit

추천 도구

더보기