32 Matching Annotations
  1. Mar 2026
    1. a lấy ngẫu nhiên ra từng sản phẩm một để kiểm tra cho đến khi nào gặp sản phẩm giảthì dừng. Tính kỳ vọng của số sản phẩm thật đã kiểm tra

      Trong lý thuyết xác suất, biến thể mà bạn nhắc đến chính là Phân phối Hình học (Geometric Distribution) nhưng tập trung vào số lần thất bại trước khi có thành công đầu tiên. Sự khác biệt cụ thể như sau: 1. Định nghĩa biến ngẫu nhiên : Biến thể thông thường ( ): Tổng số lần thử cho đến khi thành công (bao gồm cả lần thành công). Giá trị Biến thể của bạn ( ): Tổng số lần thất bại trước khi thành công. Giá trị Mối liên hệ: . 2. Hàm khối xác suất (PMF): Nếu gọi là xác suất thành công, công thức sẽ là:

      (Giải thích: Bạn có lần thất bại liên tiếp, sau đó là 1 lần thành công). 3. Các đặc trưng cơ bản: Kỳ vọng (Giá trị trung bình): (thay vì như biến thể cũ). Phương sai: (vẫn giữ nguyên như biến thể cũ). Ví dụ nhanh: Nếu bạn ném bóng rổ với tỉ lệ vào rổ là (20%): Trung bình bạn cần ném 5 lần để có quả vào rổ đầu tiên ( ). Nhưng trung bình bạn sẽ trượt 4 lần trước khi thấy quả bóng vào rổ ( ).

    1. Region-based Editing Samples
      1. Quét toàn bộ vật thể trong ảnh với các Vision Foundation Models như Grounding Dino, SAM.
      2. xác định mục tiệu với instruction và ảnh được xử lý bởi VFM.
      3. Cắt viền tự động (Tạo Mask)
      4. (Soft Mask không hoàn toàn dùng phần masked thêm một lớp mờ để các đặc trung nhỏ nằm với background
      5. Kỹ thuật nhồi ảnh : tại các step lẻ ảnh được xử lý như nào vẫn giữ nguyên nhưng tại các step chãn khi được xử lý chỉ giữ lại các thay đổi trong vùng masked còn các vùng backfround vẫn giữ nguyên.
    2. Region-based Data Generatio

      Quá trình xử lý sinh ra cặp ảnh source và target tương tự như quá trình của Free-Form Data nhưng Region based mở rộng thêm đầu vào Zt có anchor ảnh real tổng hợp thêm soft mask 1. soft mask kết hợp bởi ảnh có vật thể bị mask và thêm một add thêm một ảnh mờ dang BB của object được làm mở đi và trộn lại 2. soft mask thêm BB để đảm bảo các viền xung quang ảnh được chỉnh sửa sao cho mượt nhất nếu để mỗi masked images thì các viền thì thương khó xử lý khi đó vùng xung quang vật thể hòa vô với moi trường xung quanh

    3. Free-form Data Generation

      Ảnh Image làm anchor xử lý với mô hình SDXL U-net Denoising trained kết hợp caption của target với source qua Prompt to Prompt vào cross attention sinh ra 2 ảnh 1. Họ lấy bức ảnh chụp thật đưa qua bộ mã hóa (VAE) để nén thành dạng Latent. 2. Thay vì dùng nhiễu trắng (pure noise) như cách T2I thông thường, họ bơm một lượng nhiễu (noise) vừa đủ vào bức ảnh thật này . 3. Kết quả thu được là một ma trận nhiễu nhưng vẫn giữ lại mờ ảo cấu trúc hình khối, mảng màu của bức ảnh đời thật. 4. Ma trận nhiễu và Caption real được đưa vào SDXL xử lí rồi denoising theo Unet 5. Caption real với caption target tạo thạnh prompt to prompt rồi xử lí với Cross Attention với ma trận nhiệu có anchor 6. Sau dó quá trình đầu tiên diễn ra tạo ra đựợc ảnh soures mang đặc trưng của ảnh thực đảm bảo tính chân thực ảnh gốc và không có thiên kiến tiềm ẩn trong ảnh sources 7. quá trình thứ 2 diễn ra tương tự để sinh ảnh target nhưng khi đó họ dùng ảnh source làm anchor thây thế cho real image.

    4. Implicit biases in images
      1. Hạn chế gây ra bởi thành kiến tiềm ản trong các ảnh được tạo sinh lên ảnh ban đầu rồi tác động xấu lên ảnh target.
      2. Nguyên nhân cốt lõi gây ra Implicit Biases (Thiên kiến ngầm): Các nghiên cứu trước đó (như InstructPix2Pix) phụ thuộc hoàn toàn vào các mô hình Text-to-Image (T2I) đã được huấn luyện sẵn (pre-trained models). Do đó, sự phân phối và các đặc trưng của tập dữ liệu gốc (prior data) bị "in hằn" lên các ảnh được sinh ra. Thay vì phản ánh khách quan và bám sát vào Target Caption, các mẫu ảnh này lại bị kéo lệch về phía phong cách đặc trưng của T2I model (ví dụ: ảnh luôn có độ nét cao ảo tạo, ánh sáng cinematic, mang tính đồ họa...).
      3. Lỗ hổng từ phương pháp tiếp cận T2I (Text-to-Image): Để tạo ra các cặp dữ liệu chỉnh sửa, các phương pháp cũ sử dụng quy trình T2I thay vì I2I (Image-to-Image). Điều này đồng nghĩa với việc quá trình khử nhiễu (denoising) để tạo ra ảnh được bắt đầu hoàn toàn từ nhiễu trắng (pure noise).

      4. Việc tạo ảnh từ con số 0 khiến hệ thống thiếu vắng một bức ảnh thật làm "mỏ neo" (real image anchor). từ đó cho thiên kiến tiềm ẩn hoàn toàn thể hiện trên ảnh được sinh ra do đầu vào chỉ là nhiễu theo instruction thôithôi -> Prior data với T2I làm kích hoạt các thiên kiến tiềm ản trong ảnh trong quá trình tạo sinh.

    5. diverse real image dataset

      Sử dụng ảnh Đầu vào là ảnh real từ dữ liệu gốc làm anchor trong quá Trình xử lý I2I đồng thời kết hợp Promt to Prompt là instruction với caption kết hợp lại.

    6. LLMs along with in-context human-written instruction examples to ensure diverseediting instructions.

      Giải quyết vấn dề Instruction diversity: Kết hợp cả Instruction do human rồi mở rộng qua LLM thành các mẫu instuction da dạng hơn

    7. Missing of region-based editing.

      Mở rộng thêm augment code vùng masking để chỉnh sửa theo region thay vì toàn bộ ảnh mà chỉ vùng masked

    8. Limited instruction diversity
      1. Hạn chế này nằm ở các Instruction thiếu tính đa dạng
      2. Magic Brush sử dụng instruction từ con người để điều hướng
      3. InstructPix2Pix thay vì dùng human-aligned thì dụng LLM để sinh caption cho ảnh và instruction tuy nhiên điều này vẫn còn hạn chế bởi tính khái quát về sự đa dạng.
    9. Examples of ULTRAEDIT.

      Trong phương pháp Image to image kết hợp với prompt to Prompt để tạo sinh bộ dữ liệu mới sao cho đảm bảo chất lượng cao như dữ liệu gốc như trong các ví dụ trên thì ảnh source được chỉnh sửa với caption instruction hay có thể xem như prompt khi chat với Stable Difusion Để instruction style ảnh source thành ảnh target

    10. Misc.
      1. cho máy chạy vòng lặp trên 100 lần để sinh ra 100 bức ảnh khác nhau. Sau đó dùng công cụ chấm điểm tự động (như để vứt bỏ 99 tấm xấu, chỉ giữ lại 1 tấm hoàn hảo nhất làm dữ liệu.
      2. SDXL-Turbo (mô hình siêu tốc độ chỉ cần 3-7 bước tính toán là ra 1 ảnh)
    11. Instructions and Caption Generation
      1. Con Người viết Instruction từtừ cặp caption-image real
      2. Instruction mở rộng LLM
      3. các Instruction mở rộng đa dạng thành các sample In-Context
      4. cặp caption-Image real dùng caption làm caption source
      5. Caption source với sample in-context được tạo sinh vớ LLM khi đó mở rộng được thành editing Instruction với target caption.
    12. Is, It, Te, Im, Ts, Tt⟩
      1. Is : ảnh Source
      2. It : ảnh target
      3. Te : Instruction
      4. Im : ảnh region masked
      5. Ts : caption Source
      6. Tt : caption Target
    13. InstructPix2Pix [10] andMagicBrush [ 71],

      Hai phương pháp mà UltraEdit phát triển lên giải quyết các nhược điểm trong cả 2

    14. Paper đề xuất một cớ chế sỉnh ảnh để tại dữ liệu chất lượng cao thông qua hạn chế của các phương pháp trước đó đồng thời mở rộng thêm điều chỉnh thay vì trên toàn bộ ảnh thì ta tiến hanh trên tkhu vực masking

    1. Superkey of R: A set of attributes SK of R such that notwo tuples in any valid relation instance r(R) will havethe same value for SK. That is, for any distinct tuples t1and t2 in r(R), t1[SK]  t2[SK] Key of R: A "minimal" superkey; that is, a superkey Ksuch that removal of any attribute from K results in aset of attributes that is not a superkey16

      Example (continued)

      From above:

      {StudentID} → minimal → candidate key

      {Email} → minimal → candidate key

      {StudentID, Name} → not minimal → not a key

      Thus:

      Candidate keys = {StudentID}, {Email}

      3) Primary Key

      Among candidate keys, one is selected as the primary key.

      Enforced NOT NULL

      Used for referential integrity

    2. Basic Concepts

      Database schema (S) → set of table structures

      Relation schema (R) → structure of one table

      Relation instance (r) → actual rows in that table

      Tuple (t) → one row

      Cardinality → number of rows

      Degree → number of columns

    3. A relation r (or relation state, relation instance) ofthe relation schema R(A1, A2, . . ., An)

      khái quất về tính relation trong schemaschema

    4. elational data model: represents a database in theform of relations - 2-dimensional table with rows andcolumns of data. A database may contain one or moresuch tables. A relation schema is used to describe arelation

      là một bảng 2 chiều co hàng với cột