lucataco / demofusion

DemoFusion: Democratising High-Resolution Image Generation With No 💰

Cold

Public
9.3K runs
A100 (80GB)
GitHub
Paper

Iterate in playground

Run with an API

Playground API Examples README Versions

Input

prompt

string

Shift + Return to add a new line

Envision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignifiedEnvision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignified

Input prompt

Default: "An astronaut riding a rainbow unicorn"

negative_prompt

string

Shift + Return to add a new line

blurry, ugly, duplicate, poorly drawn, deformed, mosaicblurry, ugly, duplicate, poorly drawn, deformed, mosaic

Input Negative Prompt

Default: "blurry, ugly, duplicate, poorly drawn, deformed, mosaic"

width

integer

Width of output image

Default: 3072

height

integer

Height of output image

Default: 3072

num_inference_steps

integer

(minimum: 1, maximum: 500)

Number of denoising steps

Default: 50

guidance_scale

number

(minimum: 1, maximum: 50)

Scale for classifier-free guidance

Default: 7.5

view_batch_size

integer

The batch size for multiple denoising paths

Default: 16

stride

integer

The stride of moving local patches

Default: 64

cosine_scale_1

number

Control the strength of skip-residual

Default: 3

cosine_scale_2

number

Control the strength of dilated sampling

Default: 1

cosine_scale_3

number

Control the strength of the Gaussian filter

Default: 1

sigma

number

The standard value of the Gaussian filter

Default: 1

multi_decoder

boolean

Use multiple decoders

Default: true

seed

integer

Random seed. Leave blank to randomize the seed

Run this model in Node.js with one line of code:

npx create-replicate --model=lucataco/demofusion

or set up a project from scratch

Install Replicate’s Node.js client library:

npm install replicate

Set the REPLICATE_API_TOKEN environment variable:

export REPLICATE_API_TOKEN=<paste-your-token-here>

Find your API token in your account settings.

Import and set up the client:

import Replicate from "replicate";
import fs from "node:fs";

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

Run lucataco/demofusion using Replicate’s API. Check out the model's schema for an overview of inputs and outputs.

const output = await replicate.run(
  "lucataco/demofusion:e42a13c92efc940f40b8b739351acc611bc6ddc5af04e70099389ae11f9f0b2f",
  {
    input: {
      sigma: 0.8,
      width: 3072,
      height: 3072,
      prompt: "Envision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignified",
      stride: 64,
      multi_decoder: true,
      cosine_scale_1: 3,
      cosine_scale_2: 1,
      cosine_scale_3: 1,
      guidance_scale: 7.5,
      negative_prompt: "blurry, ugly, duplicate, poorly drawn, deformed, mosaic",
      view_batch_size: 16,
      num_inference_steps: 40
    }
  }
);

// To access the file URL:
console.log(output[0].url()); //=> "http://example.com"

// To write the file to disk:
fs.writeFile("my-image.png", output[0]);

To learn more, take a look at the guide on getting started with Node.js.

Install Replicate’s Python client library:

pip install replicate

Set the REPLICATE_API_TOKEN environment variable:

export REPLICATE_API_TOKEN=<paste-your-token-here>

Find your API token in your account settings.

Import the client:

import replicate

Run lucataco/demofusion using Replicate’s API. Check out the model's schema for an overview of inputs and outputs.

output = replicate.run(
    "lucataco/demofusion:e42a13c92efc940f40b8b739351acc611bc6ddc5af04e70099389ae11f9f0b2f",
    input={
        "sigma": 0.8,
        "width": 3072,
        "height": 3072,
        "prompt": "Envision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignified",
        "stride": 64,
        "multi_decoder": True,
        "cosine_scale_1": 3,
        "cosine_scale_2": 1,
        "cosine_scale_3": 1,
        "guidance_scale": 7.5,
        "negative_prompt": "blurry, ugly, duplicate, poorly drawn, deformed, mosaic",
        "view_batch_size": 16,
        "num_inference_steps": 40
    }
)
print(output)

To learn more, take a look at the guide on getting started with Python.

Set the REPLICATE_API_TOKEN environment variable:

export REPLICATE_API_TOKEN=<paste-your-token-here>

Find your API token in your account settings.

Run lucataco/demofusion using Replicate’s API. Check out the model's schema for an overview of inputs and outputs.

curl -s -X POST \
  -H "Authorization: Bearer $REPLICATE_API_TOKEN" \
  -H "Content-Type: application/json" \
  -H "Prefer: wait" \
  -d $'{
    "version": "lucataco/demofusion:e42a13c92efc940f40b8b739351acc611bc6ddc5af04e70099389ae11f9f0b2f",
    "input": {
      "sigma": 0.8,
      "width": 3072,
      "height": 3072,
      "prompt": "Envision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignified",
      "stride": 64,
      "multi_decoder": true,
      "cosine_scale_1": 3,
      "cosine_scale_2": 1,
      "cosine_scale_3": 1,
      "guidance_scale": 7.5,
      "negative_prompt": "blurry, ugly, duplicate, poorly drawn, deformed, mosaic",
      "view_batch_size": 16,
      "num_inference_steps": 40
    }
  }' \
  https://api.replicate.com/v1/predictions

To learn more, take a look at Replicate’s HTTP API reference docs.

Output

{
  "completed_at": "2023-12-03T15:52:10.136793Z",
  "created_at": "2023-12-03T15:43:32.679672Z",
  "data_removed": false,
  "error": null,
  "id": "oldtopdbasnqk5lfbtggdtkxeq",
  "input": {
    "sigma": 0.8,
    "width": 3072,
    "height": 3072,
    "prompt": "Envision a portrait of an elderly woman, her face a canvas of time, framed by a headscarf with muted tones of rust and cream. Her eyes, blue like faded denim. Her attire, simple yet dignified",
    "stride": 64,
    "multi_decoder": true,
    "cosine_scale_1": 3,
    "cosine_scale_2": 1,
    "cosine_scale_3": 1,
    "guidance_scale": 7.5,
    "negative_prompt": "blurry, ugly, duplicate, poorly drawn, deformed, mosaic",
    "view_batch_size": 16,
    "num_inference_steps": 40
  },
  "logs": "Using seed: 3515546982\n### Phase 1 Denoising ###\n  0%|          | 0/40 [00:00<?, ?it/s]\n  2%|▎         | 1/40 [00:00<00:29,  1.32it/s]\n  5%|▌         | 2/40 [00:00<00:14,  2.65it/s]\n  8%|▊         | 3/40 [00:00<00:09,  3.90it/s]\n 10%|█         | 4/40 [00:01<00:07,  5.01it/s]\n 12%|█▎        | 5/40 [00:01<00:05,  5.94it/s]\n 15%|█▌        | 6/40 [00:01<00:05,  6.68it/s]\n 18%|█▊        | 7/40 [00:01<00:04,  7.26it/s]\n 20%|██        | 8/40 [00:01<00:04,  7.70it/s]\n 22%|██▎       | 9/40 [00:01<00:03,  8.03it/s]\n 25%|██▌       | 10/40 [00:01<00:03,  8.26it/s]\n 28%|██▊       | 11/40 [00:01<00:03,  8.43it/s]\n 30%|███       | 12/40 [00:01<00:03,  8.55it/s]\n 32%|███▎      | 13/40 [00:02<00:03,  8.64it/s]\n 35%|███▌      | 14/40 [00:02<00:02,  8.70it/s]\n 38%|███▊      | 15/40 [00:02<00:02,  8.75it/s]\n 40%|████      | 16/40 [00:02<00:02,  8.78it/s]\n 42%|████▎     | 17/40 [00:02<00:02,  8.80it/s]\n 45%|████▌     | 18/40 [00:02<00:02,  8.81it/s]\n 48%|████▊     | 19/40 [00:02<00:02,  8.82it/s]\n 50%|█████     | 20/40 [00:02<00:02,  8.83it/s]\n 52%|█████▎    | 21/40 [00:03<00:02,  8.83it/s]\n 55%|█████▌    | 22/40 [00:03<00:02,  8.84it/s]\n 57%|█████▊    | 23/40 [00:03<00:01,  8.84it/s]\n 60%|██████    | 24/40 [00:03<00:01,  8.85it/s]\n 62%|██████▎   | 25/40 [00:03<00:01,  8.85it/s]\n 65%|██████▌   | 26/40 [00:03<00:01,  8.85it/s]\n 68%|██████▊   | 27/40 [00:03<00:01,  8.84it/s]\n 70%|███████   | 28/40 [00:03<00:01,  8.84it/s]\n 72%|███████▎  | 29/40 [00:03<00:01,  8.85it/s]\n 75%|███████▌  | 30/40 [00:04<00:01,  8.85it/s]\n 78%|███████▊  | 31/40 [00:04<00:01,  8.84it/s]\n 80%|████████  | 32/40 [00:04<00:00,  8.84it/s]\n 82%|████████▎ | 33/40 [00:04<00:00,  8.84it/s]\n 85%|████████▌ | 34/40 [00:04<00:00,  8.84it/s]\n 88%|████████▊ | 35/40 [00:04<00:00,  8.84it/s]\n 90%|█████████ | 36/40 [00:04<00:00,  8.84it/s]\n 92%|█████████▎| 37/40 [00:04<00:00,  8.84it/s]\n 95%|█████████▌| 38/40 [00:04<00:00,  8.85it/s]\n 98%|█████████▊| 39/40 [00:05<00:00,  8.85it/s]\n### Phase 1 Decoding ###\n100%|██████████| 40/40 [00:05<00:00,  8.85it/s]\n100%|██████████| 40/40 [00:05<00:00,  7.41it/s]\n### Phase 2 Denoising ###\n  0%|          | 0/40 [00:00<?, ?it/s]\n  2%|▎         | 1/40 [00:01<00:50,  1.29s/it]\n  5%|▌         | 2/40 [00:02<00:49,  1.29s/it]\n  8%|▊         | 3/40 [00:03<00:47,  1.29s/it]\n 10%|█         | 4/40 [00:05<00:46,  1.29s/it]\n 12%|█▎        | 5/40 [00:06<00:45,  1.29s/it]\n 15%|█▌        | 6/40 [00:07<00:43,  1.29s/it]\n 18%|█▊        | 7/40 [00:09<00:42,  1.29s/it]\n 20%|██        | 8/40 [00:10<00:41,  1.29s/it]\n 22%|██▎       | 9/40 [00:11<00:40,  1.30s/it]\n 25%|██▌       | 10/40 [00:12<00:38,  1.30s/it]\n 28%|██▊       | 11/40 [00:14<00:37,  1.30s/it]\n 30%|███       | 12/40 [00:15<00:36,  1.30s/it]\n 32%|███▎      | 13/40 [00:16<00:35,  1.30s/it]\n 35%|███▌      | 14/40 [00:18<00:33,  1.30s/it]\n 38%|███▊      | 15/40 [00:19<00:32,  1.30s/it]\n 40%|████      | 16/40 [00:20<00:31,  1.30s/it]\n 42%|████▎     | 17/40 [00:22<00:29,  1.30s/it]\n 45%|████▌     | 18/40 [00:23<00:28,  1.30s/it]\n 48%|████▊     | 19/40 [00:24<00:27,  1.30s/it]\n 50%|█████     | 20/40 [00:25<00:26,  1.30s/it]\n 52%|█████▎    | 21/40 [00:27<00:24,  1.30s/it]\n 55%|█████▌    | 22/40 [00:28<00:23,  1.30s/it]\n 57%|█████▊    | 23/40 [00:29<00:22,  1.30s/it]\n 60%|██████    | 24/40 [00:31<00:20,  1.30s/it]\n 62%|██████▎   | 25/40 [00:32<00:19,  1.30s/it]\n 65%|██████▌   | 26/40 [00:33<00:18,  1.30s/it]\n 68%|██████▊   | 27/40 [00:35<00:16,  1.30s/it]\n 70%|███████   | 28/40 [00:36<00:15,  1.30s/it]\n 72%|███████▎  | 29/40 [00:37<00:14,  1.30s/it]\n 75%|███████▌  | 30/40 [00:38<00:13,  1.30s/it]\n 78%|███████▊  | 31/40 [00:40<00:11,  1.30s/it]\n 80%|████████  | 32/40 [00:41<00:10,  1.30s/it]\n 82%|████████▎ | 33/40 [00:42<00:09,  1.30s/it]\n 85%|████████▌ | 34/40 [00:44<00:07,  1.30s/it]\n 88%|████████▊ | 35/40 [00:45<00:06,  1.30s/it]\n 90%|█████████ | 36/40 [00:46<00:05,  1.30s/it]\n 92%|█████████▎| 37/40 [00:48<00:03,  1.31s/it]\n 95%|█████████▌| 38/40 [00:49<00:02,  1.31s/it]\n 98%|█████████▊| 39/40 [00:50<00:01,  1.31s/it]\n### Phase 2 Decoding ###\n100%|██████████| 40/40 [00:52<00:00,  1.31s/it]\n  0%|          | 0/64 [00:00<?, ?it/s]\u001b[A\n  6%|▋         | 4/64 [00:00<00:05, 10.70it/s]\u001b[A\n  9%|▉         | 6/64 [00:01<00:19,  3.04it/s]\u001b[A\n 11%|█         | 7/64 [00:02<00:23,  2.48it/s]\u001b[A\n 12%|█▎        | 8/64 [00:03<00:26,  2.14it/s]\u001b[A\n 14%|█▍        | 9/64 [00:03<00:28,  1.94it/s]\u001b[A\n 16%|█▌        | 10/64 [00:04<00:29,  1.80it/s]\u001b[A\n 17%|█▋        | 11/64 [00:04<00:30,  1.71it/s]\u001b[A\n 19%|█▉        | 12/64 [00:05<00:31,  1.65it/s]\u001b[A\n 20%|██        | 13/64 [00:06<00:31,  1.61it/s]\u001b[A\n 22%|██▏       | 14/64 [00:06<00:31,  1.59it/s]\u001b[A\n 23%|██▎       | 15/64 [00:07<00:31,  1.56it/s]\u001b[A\n 25%|██▌       | 16/64 [00:08<00:30,  1.55it/s]\u001b[A\n 27%|██▋       | 17/64 [00:08<00:30,  1.54it/s]\u001b[A\n 28%|██▊       | 18/64 [00:09<00:29,  1.53it/s]\u001b[A\n 30%|██▉       | 19/64 [00:10<00:29,  1.53it/s]\u001b[A\n 31%|███▏      | 20/64 [00:10<00:28,  1.53it/s]\u001b[A\n 33%|███▎      | 21/64 [00:11<00:28,  1.52it/s]\u001b[A\n 34%|███▍      | 22/64 [00:12<00:27,  1.52it/s]\u001b[A\n 36%|███▌      | 23/64 [00:12<00:26,  1.52it/s]\u001b[A\n 38%|███▊      | 24/64 [00:13<00:26,  1.52it/s]\u001b[A\n 39%|███▉      | 25/64 [00:14<00:25,  1.52it/s]\u001b[A\n 41%|████      | 26/64 [00:14<00:24,  1.52it/s]\u001b[A\n 42%|████▏     | 27/64 [00:15<00:24,  1.52it/s]\u001b[A\n 44%|████▍     | 28/64 [00:16<00:23,  1.52it/s]\u001b[A\n 45%|████▌     | 29/64 [00:16<00:23,  1.52it/s]\u001b[A\n 47%|████▋     | 30/64 [00:17<00:22,  1.52it/s]\u001b[A\n 48%|████▊     | 31/64 [00:18<00:21,  1.52it/s]\u001b[A\n 50%|█████     | 32/64 [00:18<00:21,  1.52it/s]\u001b[A\n 52%|█████▏    | 33/64 [00:19<00:20,  1.52it/s]\u001b[A\n 53%|█████▎    | 34/64 [00:20<00:19,  1.52it/s]\u001b[A\n 55%|█████▍    | 35/64 [00:20<00:19,  1.52it/s]\u001b[A\n 56%|█████▋    | 36/64 [00:21<00:18,  1.52it/s]\u001b[A\n 58%|█████▊    | 37/64 [00:22<00:17,  1.52it/s]\u001b[A\n 59%|█████▉    | 38/64 [00:22<00:17,  1.52it/s]\u001b[A\n 61%|██████    | 39/64 [00:23<00:16,  1.52it/s]\u001b[A\n 62%|██████▎   | 40/64 [00:24<00:15,  1.52it/s]\u001b[A\n 64%|██████▍   | 41/64 [00:24<00:15,  1.52it/s]\u001b[A\n 66%|██████▌   | 42/64 [00:25<00:14,  1.52it/s]\u001b[A\n 67%|██████▋   | 43/64 [00:26<00:13,  1.52it/s]\u001b[A\n 69%|██████▉   | 44/64 [00:26<00:13,  1.52it/s]\u001b[A\n 70%|███████   | 45/64 [00:27<00:12,  1.52it/s]\u001b[A\n 72%|███████▏  | 46/64 [00:28<00:11,  1.52it/s]\u001b[A\n 73%|███████▎  | 47/64 [00:28<00:11,  1.52it/s]\u001b[A\n 75%|███████▌  | 48/64 [00:29<00:10,  1.52it/s]\u001b[A\n 77%|███████▋  | 49/64 [00:30<00:09,  1.52it/s]\u001b[A\n 78%|███████▊  | 50/64 [00:30<00:09,  1.52it/s]\u001b[A\n 80%|███████▉  | 51/64 [00:31<00:08,  1.52it/s]\u001b[A\n 81%|████████▏ | 52/64 [00:31<00:07,  1.52it/s]\u001b[A\n 83%|████████▎ | 53/64 [00:32<00:07,  1.52it/s]\u001b[A\n 84%|████████▍ | 54/64 [00:33<00:06,  1.52it/s]\u001b[A\n 86%|████████▌ | 55/64 [00:33<00:05,  1.52it/s]\u001b[A\n 88%|████████▊ | 56/64 [00:34<00:05,  1.52it/s]\u001b[A\n 89%|████████▉ | 57/64 [00:35<00:04,  1.52it/s]\u001b[A\n 91%|█████████ | 58/64 [00:35<00:03,  1.52it/s]\u001b[A\n 92%|█████████▏| 59/64 [00:36<00:03,  1.52it/s]\u001b[A\n 94%|█████████▍| 60/64 [00:37<00:02,  1.52it/s]\u001b[A\n 95%|█████████▌| 61/64 [00:37<00:01,  1.52it/s]\u001b[A\n 97%|█████████▋| 62/64 [00:38<00:01,  1.52it/s]\u001b[A\n 98%|█████████▊| 63/64 [00:39<00:00,  1.52it/s]\u001b[A\n100%|██████████| 64/64 [00:39<00:00,  1.52it/s]\u001b[A\n100%|██████████| 64/64 [00:39<00:00,  1.61it/s]\n100%|██████████| 40/40 [01:34<00:00,  2.36s/it]\n### Phase 3 Denoising ###\n  0%|          | 0/40 [00:00<?, ?it/s]\n  2%|▎         | 1/40 [00:03<02:10,  3.36s/it]\n  5%|▌         | 2/40 [00:06<02:07,  3.36s/it]\n  8%|▊         | 3/40 [00:10<02:04,  3.36s/it]\n 10%|█         | 4/40 [00:13<02:00,  3.36s/it]\n 12%|█▎        | 5/40 [00:16<01:57,  3.36s/it]\n 15%|█▌        | 6/40 [00:20<01:54,  3.36s/it]\n 18%|█▊        | 7/40 [00:23<01:50,  3.36s/it]\n 20%|██        | 8/40 [00:26<01:47,  3.36s/it]\n 22%|██▎       | 9/40 [00:30<01:44,  3.36s/it]\n 25%|██▌       | 10/40 [00:33<01:40,  3.36s/it]\n 28%|██▊       | 11/40 [00:36<01:37,  3.36s/it]\n 30%|███       | 12/40 [00:40<01:34,  3.36s/it]\n 32%|███▎      | 13/40 [00:43<01:30,  3.36s/it]\n 35%|███▌      | 14/40 [00:47<01:27,  3.36s/it]\n 38%|███▊      | 15/40 [00:50<01:24,  3.36s/it]\n 40%|████      | 16/40 [00:53<01:20,  3.37s/it]\n 42%|████▎     | 17/40 [00:57<01:17,  3.37s/it]\n 45%|████▌     | 18/40 [01:00<01:14,  3.37s/it]\n 48%|████▊     | 19/40 [01:03<01:10,  3.37s/it]\n 50%|█████     | 20/40 [01:07<01:07,  3.37s/it]\n 52%|█████▎    | 21/40 [01:10<01:03,  3.37s/it]\n 55%|█████▌    | 22/40 [01:13<01:00,  3.37s/it]\n 57%|█████▊    | 23/40 [01:17<00:57,  3.37s/it]\n 60%|██████    | 24/40 [01:20<00:53,  3.37s/it]\n 62%|██████▎   | 25/40 [01:24<00:50,  3.37s/it]\n 65%|██████▌   | 26/40 [01:27<00:47,  3.37s/it]\n 68%|██████▊   | 27/40 [01:30<00:43,  3.37s/it]\n 70%|███████   | 28/40 [01:34<00:40,  3.37s/it]\n 72%|███████▎  | 29/40 [01:37<00:37,  3.37s/it]\n 75%|███████▌  | 30/40 [01:40<00:33,  3.37s/it]\n 78%|███████▊  | 31/40 [01:44<00:30,  3.37s/it]\n 80%|████████  | 32/40 [01:47<00:26,  3.37s/it]\n 82%|████████▎ | 33/40 [01:51<00:23,  3.37s/it]\n 85%|████████▌ | 34/40 [01:54<00:20,  3.37s/it]\n 88%|████████▊ | 35/40 [01:57<00:16,  3.37s/it]\n 90%|█████████ | 36/40 [02:01<00:13,  3.37s/it]\n 92%|█████████▎| 37/40 [02:04<00:10,  3.37s/it]\n 95%|█████████▌| 38/40 [02:07<00:06,  3.37s/it]\n 98%|█████████▊| 39/40 [02:11<00:03,  3.37s/it]\n### Phase 3 Decoding ###\n100%|██████████| 40/40 [02:14<00:00,  3.37s/it]\n  0%|          | 0/144 [00:00<?, ?it/s]\u001b[A\n  3%|▎         | 4/144 [00:00<00:12, 10.82it/s]\u001b[A\n  4%|▍         | 6/144 [00:01<00:45,  3.04it/s]\u001b[A\n  5%|▍         | 7/144 [00:02<00:55,  2.47it/s]\u001b[A\n  6%|▌         | 8/144 [00:03<01:03,  2.14it/s]\u001b[A\n  6%|▋         | 9/144 [00:03<01:09,  1.93it/s]\u001b[A\n  7%|▋         | 10/144 [00:04<01:14,  1.80it/s]\u001b[A\n  8%|▊         | 11/144 [00:04<01:17,  1.71it/s]\u001b[A\n  8%|▊         | 12/144 [00:05<01:19,  1.65it/s]\u001b[A\n  9%|▉         | 13/144 [00:06<01:21,  1.61it/s]\u001b[A\n 10%|▉         | 14/144 [00:06<01:22,  1.58it/s]\u001b[A\n 10%|█         | 15/144 [00:07<01:22,  1.56it/s]\u001b[A\n 11%|█         | 16/144 [00:08<01:22,  1.55it/s]\u001b[A\n 12%|█▏        | 17/144 [00:08<01:22,  1.54it/s]\u001b[A\n 12%|█▎        | 18/144 [00:09<01:22,  1.53it/s]\u001b[A\n 13%|█▎        | 19/144 [00:10<01:21,  1.53it/s]\u001b[A\n 14%|█▍        | 20/144 [00:10<01:21,  1.52it/s]\u001b[A\n 15%|█▍        | 21/144 [00:11<01:20,  1.52it/s]\u001b[A\n 15%|█▌        | 22/144 [00:12<01:20,  1.52it/s]\u001b[A\n 16%|█▌        | 23/144 [00:12<01:19,  1.52it/s]\u001b[A\n 17%|█▋        | 24/144 [00:13<01:18,  1.52it/s]\u001b[A\n 17%|█▋        | 25/144 [00:14<01:18,  1.52it/s]\u001b[A\n 18%|█▊        | 26/144 [00:14<01:17,  1.52it/s]\u001b[A\n 19%|█▉        | 27/144 [00:15<01:17,  1.52it/s]\u001b[A\n 19%|█▉        | 28/144 [00:16<01:16,  1.52it/s]\u001b[A\n 20%|██        | 29/144 [00:16<01:15,  1.52it/s]\u001b[A\n 21%|██        | 30/144 [00:17<01:15,  1.52it/s]\u001b[A\n 22%|██▏       | 31/144 [00:18<01:14,  1.52it/s]\u001b[A\n 22%|██▏       | 32/144 [00:18<01:13,  1.52it/s]\u001b[A\n 23%|██▎       | 33/144 [00:19<01:13,  1.52it/s]\u001b[A\n 24%|██▎       | 34/144 [00:20<01:12,  1.52it/s]\u001b[A\n 24%|██▍       | 35/144 [00:20<01:11,  1.51it/s]\u001b[A\n 25%|██▌       | 36/144 [00:21<01:11,  1.52it/s]\u001b[A\n 26%|██▌       | 37/144 [00:22<01:10,  1.52it/s]\u001b[A\n 26%|██▋       | 38/144 [00:22<01:09,  1.52it/s]\u001b[A\n 27%|██▋       | 39/144 [00:23<01:09,  1.52it/s]\u001b[A\n 28%|██▊       | 40/144 [00:24<01:08,  1.52it/s]\u001b[A\n 28%|██▊       | 41/144 [00:24<01:07,  1.52it/s]\u001b[A\n 29%|██▉       | 42/144 [00:25<01:07,  1.52it/s]\u001b[A\n 30%|██▉       | 43/144 [00:26<01:06,  1.52it/s]\u001b[A\n 31%|███       | 44/144 [00:26<01:05,  1.52it/s]\u001b[A\n 31%|███▏      | 45/144 [00:27<01:05,  1.52it/s]\u001b[A\n 32%|███▏      | 46/144 [00:28<01:04,  1.52it/s]\u001b[A\n 33%|███▎      | 47/144 [00:28<01:04,  1.52it/s]\u001b[A\n 33%|███▎      | 48/144 [00:29<01:03,  1.52it/s]\u001b[A\n 34%|███▍      | 49/144 [00:30<01:02,  1.52it/s]\u001b[A\n 35%|███▍      | 50/144 [00:30<01:02,  1.52it/s]\u001b[A\n 35%|███▌      | 51/144 [00:31<01:01,  1.52it/s]\u001b[A\n 36%|███▌      | 52/144 [00:32<01:00,  1.52it/s]\u001b[A\n 37%|███▋      | 53/144 [00:32<00:59,  1.52it/s]\u001b[A\n 38%|███▊      | 54/144 [00:33<00:59,  1.52it/s]\u001b[A\n 38%|███▊      | 55/144 [00:33<00:58,  1.52it/s]\u001b[A\n 39%|███▉      | 56/144 [00:34<00:58,  1.52it/s]\u001b[A\n 40%|███▉      | 57/144 [00:35<00:57,  1.52it/s]\u001b[A\n 40%|████      | 58/144 [00:35<00:56,  1.51it/s]\u001b[A\n 41%|████      | 59/144 [00:36<00:56,  1.52it/s]\u001b[A\n 42%|████▏     | 60/144 [00:37<00:55,  1.52it/s]\u001b[A\n 42%|████▏     | 61/144 [00:37<00:54,  1.51it/s]\u001b[A\n 43%|████▎     | 62/144 [00:38<00:54,  1.51it/s]\u001b[A\n 44%|████▍     | 63/144 [00:39<00:53,  1.52it/s]\u001b[A\n 44%|████▍     | 64/144 [00:39<00:52,  1.52it/s]\u001b[A\n 45%|████▌     | 65/144 [00:40<00:52,  1.52it/s]\u001b[A\n 46%|████▌     | 66/144 [00:41<00:51,  1.52it/s]\u001b[A\n 47%|████▋     | 67/144 [00:41<00:50,  1.52it/s]\u001b[A\n 47%|████▋     | 68/144 [00:42<00:50,  1.52it/s]\u001b[A\n 48%|████▊     | 69/144 [00:43<00:49,  1.52it/s]\u001b[A\n 49%|████▊     | 70/144 [00:43<00:48,  1.52it/s]\u001b[A\n 49%|████▉     | 71/144 [00:44<00:48,  1.52it/s]\u001b[A\n 50%|█████     | 72/144 [00:45<00:47,  1.52it/s]\u001b[A\n 51%|█████     | 73/144 [00:45<00:46,  1.51it/s]\u001b[A\n 51%|█████▏    | 74/144 [00:46<00:46,  1.52it/s]\u001b[A\n 52%|█████▏    | 75/144 [00:47<00:45,  1.52it/s]\u001b[A\n 53%|█████▎    | 76/144 [00:47<00:44,  1.52it/s]\u001b[A\n 53%|█████▎    | 77/144 [00:48<00:44,  1.52it/s]\u001b[A\n 54%|█████▍    | 78/144 [00:49<00:43,  1.52it/s]\u001b[A\n 55%|█████▍    | 79/144 [00:49<00:42,  1.52it/s]\u001b[A\n 56%|█████▌    | 80/144 [00:50<00:42,  1.52it/s]\u001b[A\n 56%|█████▋    | 81/144 [00:51<00:41,  1.52it/s]\u001b[A\n 57%|█████▋    | 82/144 [00:51<00:40,  1.52it/s]\u001b[A\n 58%|█████▊    | 83/144 [00:52<00:40,  1.51it/s]\u001b[A\n 58%|█████▊    | 84/144 [00:53<00:39,  1.51it/s]\u001b[A\n 59%|█████▉    | 85/144 [00:53<00:38,  1.51it/s]\u001b[A\n 60%|█████▉    | 86/144 [00:54<00:38,  1.51it/s]\u001b[A\n 60%|██████    | 87/144 [00:55<00:37,  1.52it/s]\u001b[A\n 61%|██████    | 88/144 [00:55<00:36,  1.52it/s]\u001b[A\n 62%|██████▏   | 89/144 [00:56<00:36,  1.52it/s]\u001b[A\n 62%|██████▎   | 90/144 [00:57<00:35,  1.52it/s]\u001b[A\n 63%|██████▎   | 91/144 [00:57<00:34,  1.52it/s]\u001b[A\n 64%|██████▍   | 92/144 [00:58<00:34,  1.52it/s]\u001b[A\n 65%|██████▍   | 93/144 [00:59<00:33,  1.51it/s]\u001b[A\n 65%|██████▌   | 94/144 [00:59<00:33,  1.51it/s]\u001b[A\n 66%|██████▌   | 95/144 [01:00<00:32,  1.52it/s]\u001b[A\n 67%|██████▋   | 96/144 [01:01<00:31,  1.52it/s]\u001b[A\n 67%|██████▋   | 97/144 [01:01<00:31,  1.52it/s]\u001b[A\n 68%|██████▊   | 98/144 [01:02<00:30,  1.51it/s]\u001b[A\n 69%|██████▉   | 99/144 [01:03<00:29,  1.52it/s]\u001b[A\n 69%|██████▉   | 100/144 [01:03<00:29,  1.52it/s]\u001b[A\n 70%|███████   | 101/144 [01:04<00:28,  1.52it/s]\u001b[A\n 71%|███████   | 102/144 [01:04<00:27,  1.52it/s]\u001b[A\n 72%|███████▏  | 103/144 [01:05<00:27,  1.51it/s]\u001b[A\n 72%|███████▏  | 104/144 [01:06<00:26,  1.52it/s]\u001b[A\n 73%|███████▎  | 105/144 [01:06<00:25,  1.51it/s]\u001b[A\n 74%|███████▎  | 106/144 [01:07<00:25,  1.52it/s]\u001b[A\n 74%|███████▍  | 107/144 [01:08<00:24,  1.52it/s]\u001b[A\n 75%|███████▌  | 108/144 [01:08<00:23,  1.52it/s]\u001b[A\n 76%|███████▌  | 109/144 [01:09<00:23,  1.52it/s]\u001b[A\n 76%|███████▋  | 110/144 [01:10<00:22,  1.52it/s]\u001b[A\n 77%|███████▋  | 111/144 [01:10<00:21,  1.52it/s]\u001b[A\n 78%|███████▊  | 112/144 [01:11<00:21,  1.52it/s]\u001b[A\n 78%|███████▊  | 113/144 [01:12<00:20,  1.52it/s]\u001b[A\n 79%|███████▉  | 114/144 [01:12<00:19,  1.52it/s]\u001b[A\n 80%|███████▉  | 115/144 [01:13<00:19,  1.52it/s]\u001b[A\n 81%|████████  | 116/144 [01:14<00:18,  1.52it/s]\u001b[A\n 81%|████████▏ | 117/144 [01:14<00:17,  1.52it/s]\u001b[A\n 82%|████████▏ | 118/144 [01:15<00:17,  1.52it/s]\u001b[A\n 83%|████████▎ | 119/144 [01:16<00:16,  1.52it/s]\u001b[A\n 83%|████████▎ | 120/144 [01:16<00:15,  1.52it/s]\u001b[A\n 84%|████████▍ | 121/144 [01:17<00:15,  1.52it/s]\u001b[A\n 85%|████████▍ | 122/144 [01:18<00:14,  1.52it/s]\u001b[A\n 85%|████████▌ | 123/144 [01:18<00:13,  1.52it/s]\u001b[A\n 86%|████████▌ | 124/144 [01:19<00:13,  1.52it/s]\u001b[A\n 87%|████████▋ | 125/144 [01:20<00:12,  1.52it/s]\u001b[A\n 88%|████████▊ | 126/144 [01:20<00:11,  1.52it/s]\u001b[A\n 88%|████████▊ | 127/144 [01:21<00:11,  1.52it/s]\u001b[A\n 89%|████████▉ | 128/144 [01:22<00:10,  1.52it/s]\u001b[A\n 90%|████████▉ | 129/144 [01:22<00:09,  1.52it/s]\u001b[A\n 90%|█████████ | 130/144 [01:23<00:09,  1.52it/s]\u001b[A\n 91%|█████████ | 131/144 [01:24<00:08,  1.52it/s]\u001b[A\n 92%|█████████▏| 132/144 [01:24<00:07,  1.52it/s]\u001b[A\n 92%|█████████▏| 133/144 [01:25<00:07,  1.52it/s]\u001b[A\n 93%|█████████▎| 134/144 [01:26<00:06,  1.52it/s]\u001b[A\n 94%|█████████▍| 135/144 [01:26<00:05,  1.52it/s]\u001b[A\n 94%|█████████▍| 136/144 [01:27<00:05,  1.52it/s]\u001b[A\n 95%|█████████▌| 137/144 [01:28<00:04,  1.52it/s]\u001b[A\n 96%|█████████▌| 138/144 [01:28<00:03,  1.52it/s]\u001b[A\n 97%|█████████▋| 139/144 [01:29<00:03,  1.52it/s]\u001b[A\n 97%|█████████▋| 140/144 [01:30<00:02,  1.52it/s]\u001b[A\n 98%|█████████▊| 141/144 [01:30<00:01,  1.52it/s]\u001b[A\n 99%|█████████▊| 142/144 [01:31<00:01,  1.52it/s]\u001b[A\n 99%|█████████▉| 143/144 [01:32<00:00,  1.52it/s]\u001b[A\n100%|██████████| 144/144 [01:32<00:00,  1.52it/s]\u001b[A\n100%|██████████| 144/144 [01:32<00:00,  1.55it/s]\n100%|██████████| 40/40 [03:49<00:00,  5.75s/it]",
  "metrics": {
    "predict_time": 339.148827,
    "total_time": 517.457121
  },
  "output": [
    "https://replicate.delivery/pbxt/YXooeuOxKN3KUS9DvHcJH7WUkATC80HRU6uWM8iDaNsTsSfRA/out-0.png",
    "https://replicate.delivery/pbxt/SncySaIASuKkAVeV97h0NrPP6KcueHX8dRY4rfllWRORxK9jA/out-1.png",
    "https://replicate.delivery/pbxt/AWKCn7hb5UJNLFpfhfdhNRTfnsmU4kyWxsiq21swwjZSxK9jA/out-2.png"
  ],
  "started_at": "2023-12-03T15:46:30.987966Z",
  "status": "succeeded",
  "urls": {
    "get": "https://api.replicate.com/v1/predictions/oldtopdbasnqk5lfbtggdtkxeq",
    "cancel": "https://api.replicate.com/v1/predictions/oldtopdbasnqk5lfbtggdtkxeq/cancel"
  },
  "version": "6195e01563e3715c3eb76c11e29c46203037ce9f205c786bec90f08b36d393fb"
}

Generated in

5 minutes 39 seconds

Tweak itReport View full prediction

Using seed: 3515546982
### Phase 1 Denoising ###
  0%|          | 0/40 [00:00<?, ?it/s]
  2%|▎         | 1/40 [00:00<00:29,  1.32it/s]
  5%|▌         | 2/40 [00:00<00:14,  2.65it/s]
  8%|▊         | 3/40 [00:00<00:09,  3.90it/s]
 10%|█         | 4/40 [00:01<00:07,  5.01it/s]
 12%|█▎        | 5/40 [00:01<00:05,  5.94it/s]
 15%|█▌        | 6/40 [00:01<00:05,  6.68it/s]
 18%|█▊        | 7/40 [00:01<00:04,  7.26it/s]
 20%|██        | 8/40 [00:01<00:04,  7.70it/s]
 22%|██▎       | 9/40 [00:01<00:03,  8.03it/s]
 25%|██▌       | 10/40 [00:01<00:03,  8.26it/s]
 28%|██▊       | 11/40 [00:01<00:03,  8.43it/s]
 30%|███       | 12/40 [00:01<00:03,  8.55it/s]
 32%|███▎      | 13/40 [00:02<00:03,  8.64it/s]
 35%|███▌      | 14/40 [00:02<00:02,  8.70it/s]
 38%|███▊      | 15/40 [00:02<00:02,  8.75it/s]
 40%|████      | 16/40 [00:02<00:02,  8.78it/s]
 42%|████▎     | 17/40 [00:02<00:02,  8.80it/s]
 45%|████▌     | 18/40 [00:02<00:02,  8.81it/s]
 48%|████▊     | 19/40 [00:02<00:02,  8.82it/s]
 50%|█████     | 20/40 [00:02<00:02,  8.83it/s]
 52%|█████▎    | 21/40 [00:03<00:02,  8.83it/s]
 55%|█████▌    | 22/40 [00:03<00:02,  8.84it/s]
 57%|█████▊    | 23/40 [00:03<00:01,  8.84it/s]
 60%|██████    | 24/40 [00:03<00:01,  8.85it/s]
 62%|██████▎   | 25/40 [00:03<00:01,  8.85it/s]
 65%|██████▌   | 26/40 [00:03<00:01,  8.85it/s]
 68%|██████▊   | 27/40 [00:03<00:01,  8.84it/s]
 70%|███████   | 28/40 [00:03<00:01,  8.84it/s]
 72%|███████▎  | 29/40 [00:03<00:01,  8.85it/s]
 75%|███████▌  | 30/40 [00:04<00:01,  8.85it/s]
 78%|███████▊  | 31/40 [00:04<00:01,  8.84it/s]
 80%|████████  | 32/40 [00:04<00:00,  8.84it/s]
 82%|████████▎ | 33/40 [00:04<00:00,  8.84it/s]
 85%|████████▌ | 34/40 [00:04<00:00,  8.84it/s]
 88%|████████▊ | 35/40 [00:04<00:00,  8.84it/s]
 90%|█████████ | 36/40 [00:04<00:00,  8.84it/s]
 92%|█████████▎| 37/40 [00:04<00:00,  8.84it/s]
 95%|█████████▌| 38/40 [00:04<00:00,  8.85it/s]
 98%|█████████▊| 39/40 [00:05<00:00,  8.85it/s]
### Phase 1 Decoding ###
100%|██████████| 40/40 [00:05<00:00,  8.85it/s]
100%|██████████| 40/40 [00:05<00:00,  7.41it/s]
### Phase 2 Denoising ###
  0%|          | 0/40 [00:00<?, ?it/s]
  2%|▎         | 1/40 [00:01<00:50,  1.29s/it]
  5%|▌         | 2/40 [00:02<00:49,  1.29s/it]
  8%|▊         | 3/40 [00:03<00:47,  1.29s/it]
 10%|█         | 4/40 [00:05<00:46,  1.29s/it]
 12%|█▎        | 5/40 [00:06<00:45,  1.29s/it]
 15%|█▌        | 6/40 [00:07<00:43,  1.29s/it]
 18%|█▊        | 7/40 [00:09<00:42,  1.29s/it]
 20%|██        | 8/40 [00:10<00:41,  1.29s/it]
 22%|██▎       | 9/40 [00:11<00:40,  1.30s/it]
 25%|██▌       | 10/40 [00:12<00:38,  1.30s/it]
 28%|██▊       | 11/40 [00:14<00:37,  1.30s/it]
 30%|███       | 12/40 [00:15<00:36,  1.30s/it]
 32%|███▎      | 13/40 [00:16<00:35,  1.30s/it]
 35%|███▌      | 14/40 [00:18<00:33,  1.30s/it]
 38%|███▊      | 15/40 [00:19<00:32,  1.30s/it]
 40%|████      | 16/40 [00:20<00:31,  1.30s/it]
 42%|████▎     | 17/40 [00:22<00:29,  1.30s/it]
 45%|████▌     | 18/40 [00:23<00:28,  1.30s/it]
 48%|████▊     | 19/40 [00:24<00:27,  1.30s/it]
 50%|█████     | 20/40 [00:25<00:26,  1.30s/it]
 52%|█████▎    | 21/40 [00:27<00:24,  1.30s/it]
 55%|█████▌    | 22/40 [00:28<00:23,  1.30s/it]
 57%|█████▊    | 23/40 [00:29<00:22,  1.30s/it]
 60%|██████    | 24/40 [00:31<00:20,  1.30s/it]
 62%|██████▎   | 25/40 [00:32<00:19,  1.30s/it]
 65%|██████▌   | 26/40 [00:33<00:18,  1.30s/it]
 68%|██████▊   | 27/40 [00:35<00:16,  1.30s/it]
 70%|███████   | 28/40 [00:36<00:15,  1.30s/it]
 72%|███████▎  | 29/40 [00:37<00:14,  1.30s/it]
 75%|███████▌  | 30/40 [00:38<00:13,  1.30s/it]
 78%|███████▊  | 31/40 [00:40<00:11,  1.30s/it]
 80%|████████  | 32/40 [00:41<00:10,  1.30s/it]
 82%|████████▎ | 33/40 [00:42<00:09,  1.30s/it]
 85%|████████▌ | 34/40 [00:44<00:07,  1.30s/it]
 88%|████████▊ | 35/40 [00:45<00:06,  1.30s/it]
 90%|█████████ | 36/40 [00:46<00:05,  1.30s/it]
 92%|█████████▎| 37/40 [00:48<00:03,  1.31s/it]
 95%|█████████▌| 38/40 [00:49<00:02,  1.31s/it]
 98%|█████████▊| 39/40 [00:50<00:01,  1.31s/it]
### Phase 2 Decoding ###
100%|██████████| 40/40 [00:52<00:00,  1.31s/it]
  0%|          | 0/64 [00:00<?, ?it/s]
  6%|▋         | 4/64 [00:00<00:05, 10.70it/s]
  9%|▉         | 6/64 [00:01<00:19,  3.04it/s]
 11%|█         | 7/64 [00:02<00:23,  2.48it/s]
 12%|█▎        | 8/64 [00:03<00:26,  2.14it/s]
 14%|█▍        | 9/64 [00:03<00:28,  1.94it/s]
 16%|█▌        | 10/64 [00:04<00:29,  1.80it/s]
 17%|█▋        | 11/64 [00:04<00:30,  1.71it/s]
 19%|█▉        | 12/64 [00:05<00:31,  1.65it/s]
 20%|██        | 13/64 [00:06<00:31,  1.61it/s]
 22%|██▏       | 14/64 [00:06<00:31,  1.59it/s]
 23%|██▎       | 15/64 [00:07<00:31,  1.56it/s]
 25%|██▌       | 16/64 [00:08<00:30,  1.55it/s]
 27%|██▋       | 17/64 [00:08<00:30,  1.54it/s]
 28%|██▊       | 18/64 [00:09<00:29,  1.53it/s]
 30%|██▉       | 19/64 [00:10<00:29,  1.53it/s]
 31%|███▏      | 20/64 [00:10<00:28,  1.53it/s]
 33%|███▎      | 21/64 [00:11<00:28,  1.52it/s]
 34%|███▍      | 22/64 [00:12<00:27,  1.52it/s]
 36%|███▌      | 23/64 [00:12<00:26,  1.52it/s]
 38%|███▊      | 24/64 [00:13<00:26,  1.52it/s]
 39%|███▉      | 25/64 [00:14<00:25,  1.52it/s]
 41%|████      | 26/64 [00:14<00:24,  1.52it/s]
 42%|████▏     | 27/64 [00:15<00:24,  1.52it/s]
 44%|████▍     | 28/64 [00:16<00:23,  1.52it/s]
 45%|████▌     | 29/64 [00:16<00:23,  1.52it/s]
 47%|████▋     | 30/64 [00:17<00:22,  1.52it/s]
 48%|████▊     | 31/64 [00:18<00:21,  1.52it/s]
 50%|█████     | 32/64 [00:18<00:21,  1.52it/s]
 52%|█████▏    | 33/64 [00:19<00:20,  1.52it/s]
 53%|█████▎    | 34/64 [00:20<00:19,  1.52it/s]
 55%|█████▍    | 35/64 [00:20<00:19,  1.52it/s]
 56%|█████▋    | 36/64 [00:21<00:18,  1.52it/s]
 58%|█████▊    | 37/64 [00:22<00:17,  1.52it/s]
 59%|█████▉    | 38/64 [00:22<00:17,  1.52it/s]
 61%|██████    | 39/64 [00:23<00:16,  1.52it/s]
 62%|██████▎   | 40/64 [00:24<00:15,  1.52it/s]
 64%|██████▍   | 41/64 [00:24<00:15,  1.52it/s]
 66%|██████▌   | 42/64 [00:25<00:14,  1.52it/s]
 67%|██████▋   | 43/64 [00:26<00:13,  1.52it/s]
 69%|██████▉   | 44/64 [00:26<00:13,  1.52it/s]
 70%|███████   | 45/64 [00:27<00:12,  1.52it/s]
 72%|███████▏  | 46/64 [00:28<00:11,  1.52it/s]
 73%|███████▎  | 47/64 [00:28<00:11,  1.52it/s]
 75%|███████▌  | 48/64 [00:29<00:10,  1.52it/s]
 77%|███████▋  | 49/64 [00:30<00:09,  1.52it/s]
 78%|███████▊  | 50/64 [00:30<00:09,  1.52it/s]
 80%|███████▉  | 51/64 [00:31<00:08,  1.52it/s]
 81%|████████▏ | 52/64 [00:31<00:07,  1.52it/s]
 83%|████████▎ | 53/64 [00:32<00:07,  1.52it/s]
 84%|████████▍ | 54/64 [00:33<00:06,  1.52it/s]
 86%|████████▌ | 55/64 [00:33<00:05,  1.52it/s]
 88%|████████▊ | 56/64 [00:34<00:05,  1.52it/s]
 89%|████████▉ | 57/64 [00:35<00:04,  1.52it/s]
 91%|█████████ | 58/64 [00:35<00:03,  1.52it/s]
 92%|█████████▏| 59/64 [00:36<00:03,  1.52it/s]
 94%|█████████▍| 60/64 [00:37<00:02,  1.52it/s]
 95%|█████████▌| 61/64 [00:37<00:01,  1.52it/s]
 97%|█████████▋| 62/64 [00:38<00:01,  1.52it/s]
 98%|█████████▊| 63/64 [00:39<00:00,  1.52it/s]
100%|██████████| 64/64 [00:39<00:00,  1.52it/s]
100%|██████████| 64/64 [00:39<00:00,  1.61it/s]
100%|██████████| 40/40 [01:34<00:00,  2.36s/it]
### Phase 3 Denoising ###
  0%|          | 0/40 [00:00<?, ?it/s]
  2%|▎         | 1/40 [00:03<02:10,  3.36s/it]
  5%|▌         | 2/40 [00:06<02:07,  3.36s/it]
  8%|▊         | 3/40 [00:10<02:04,  3.36s/it]
 10%|█         | 4/40 [00:13<02:00,  3.36s/it]
 12%|█▎        | 5/40 [00:16<01:57,  3.36s/it]
 15%|█▌        | 6/40 [00:20<01:54,  3.36s/it]
 18%|█▊        | 7/40 [00:23<01:50,  3.36s/it]
 20%|██        | 8/40 [00:26<01:47,  3.36s/it]
 22%|██▎       | 9/40 [00:30<01:44,  3.36s/it]
 25%|██▌       | 10/40 [00:33<01:40,  3.36s/it]
 28%|██▊       | 11/40 [00:36<01:37,  3.36s/it]
 30%|███       | 12/40 [00:40<01:34,  3.36s/it]
 32%|███▎      | 13/40 [00:43<01:30,  3.36s/it]
 35%|███▌      | 14/40 [00:47<01:27,  3.36s/it]
 38%|███▊      | 15/40 [00:50<01:24,  3.36s/it]
 40%|████      | 16/40 [00:53<01:20,  3.37s/it]
 42%|████▎     | 17/40 [00:57<01:17,  3.37s/it]
 45%|████▌     | 18/40 [01:00<01:14,  3.37s/it]
 48%|████▊     | 19/40 [01:03<01:10,  3.37s/it]
 50%|█████     | 20/40 [01:07<01:07,  3.37s/it]
 52%|█████▎    | 21/40 [01:10<01:03,  3.37s/it]
 55%|█████▌    | 22/40 [01:13<01:00,  3.37s/it]
 57%|█████▊    | 23/40 [01:17<00:57,  3.37s/it]
 60%|██████    | 24/40 [01:20<00:53,  3.37s/it]
 62%|██████▎   | 25/40 [01:24<00:50,  3.37s/it]
 65%|██████▌   | 26/40 [01:27<00:47,  3.37s/it]
 68%|██████▊   | 27/40 [01:30<00:43,  3.37s/it]
 70%|███████   | 28/40 [01:34<00:40,  3.37s/it]
 72%|███████▎  | 29/40 [01:37<00:37,  3.37s/it]
 75%|███████▌  | 30/40 [01:40<00:33,  3.37s/it]
 78%|███████▊  | 31/40 [01:44<00:30,  3.37s/it]
 80%|████████  | 32/40 [01:47<00:26,  3.37s/it]
 82%|████████▎ | 33/40 [01:51<00:23,  3.37s/it]
 85%|████████▌ | 34/40 [01:54<00:20,  3.37s/it]
 88%|████████▊ | 35/40 [01:57<00:16,  3.37s/it]
 90%|█████████ | 36/40 [02:01<00:13,  3.37s/it]
 92%|█████████▎| 37/40 [02:04<00:10,  3.37s/it]
 95%|█████████▌| 38/40 [02:07<00:06,  3.37s/it]
 98%|█████████▊| 39/40 [02:11<00:03,  3.37s/it]
### Phase 3 Decoding ###
100%|██████████| 40/40 [02:14<00:00,  3.37s/it]
  0%|          | 0/144 [00:00<?, ?it/s]
  3%|▎         | 4/144 [00:00<00:12, 10.82it/s]
  4%|▍         | 6/144 [00:01<00:45,  3.04it/s]
  5%|▍         | 7/144 [00:02<00:55,  2.47it/s]
  6%|▌         | 8/144 [00:03<01:03,  2.14it/s]
  6%|▋         | 9/144 [00:03<01:09,  1.93it/s]
  7%|▋         | 10/144 [00:04<01:14,  1.80it/s]
  8%|▊         | 11/144 [00:04<01:17,  1.71it/s]
  8%|▊         | 12/144 [00:05<01:19,  1.65it/s]
  9%|▉         | 13/144 [00:06<01:21,  1.61it/s]
 10%|▉         | 14/144 [00:06<01:22,  1.58it/s]
 10%|█         | 15/144 [00:07<01:22,  1.56it/s]
 11%|█         | 16/144 [00:08<01:22,  1.55it/s]
 12%|█▏        | 17/144 [00:08<01:22,  1.54it/s]
 12%|█▎        | 18/144 [00:09<01:22,  1.53it/s]
 13%|█▎        | 19/144 [00:10<01:21,  1.53it/s]
 14%|█▍        | 20/144 [00:10<01:21,  1.52it/s]
 15%|█▍        | 21/144 [00:11<01:20,  1.52it/s]
 15%|█▌        | 22/144 [00:12<01:20,  1.52it/s]
 16%|█▌        | 23/144 [00:12<01:19,  1.52it/s]
 17%|█▋        | 24/144 [00:13<01:18,  1.52it/s]
 17%|█▋        | 25/144 [00:14<01:18,  1.52it/s]
 18%|█▊        | 26/144 [00:14<01:17,  1.52it/s]
 19%|█▉        | 27/144 [00:15<01:17,  1.52it/s]
 19%|█▉        | 28/144 [00:16<01:16,  1.52it/s]
 20%|██        | 29/144 [00:16<01:15,  1.52it/s]
 21%|██        | 30/144 [00:17<01:15,  1.52it/s]
 22%|██▏       | 31/144 [00:18<01:14,  1.52it/s]
 22%|██▏       | 32/144 [00:18<01:13,  1.52it/s]
 23%|██▎       | 33/144 [00:19<01:13,  1.52it/s]
 24%|██▎       | 34/144 [00:20<01:12,  1.52it/s]
 24%|██▍       | 35/144 [00:20<01:11,  1.51it/s]
 25%|██▌       | 36/144 [00:21<01:11,  1.52it/s]
 26%|██▌       | 37/144 [00:22<01:10,  1.52it/s]
 26%|██▋       | 38/144 [00:22<01:09,  1.52it/s]
 27%|██▋       | 39/144 [00:23<01:09,  1.52it/s]
 28%|██▊       | 40/144 [00:24<01:08,  1.52it/s]
 28%|██▊       | 41/144 [00:24<01:07,  1.52it/s]
 29%|██▉       | 42/144 [00:25<01:07,  1.52it/s]
 30%|██▉       | 43/144 [00:26<01:06,  1.52it/s]
 31%|███       | 44/144 [00:26<01:05,  1.52it/s]
 31%|███▏      | 45/144 [00:27<01:05,  1.52it/s]
 32%|███▏      | 46/144 [00:28<01:04,  1.52it/s]
 33%|███▎      | 47/144 [00:28<01:04,  1.52it/s]
 33%|███▎      | 48/144 [00:29<01:03,  1.52it/s]
 34%|███▍      | 49/144 [00:30<01:02,  1.52it/s]
 35%|███▍      | 50/144 [00:30<01:02,  1.52it/s]
 35%|███▌      | 51/144 [00:31<01:01,  1.52it/s]
 36%|███▌      | 52/144 [00:32<01:00,  1.52it/s]
 37%|███▋      | 53/144 [00:32<00:59,  1.52it/s]
 38%|███▊      | 54/144 [00:33<00:59,  1.52it/s]
 38%|███▊      | 55/144 [00:33<00:58,  1.52it/s]
 39%|███▉      | 56/144 [00:34<00:58,  1.52it/s]
 40%|███▉      | 57/144 [00:35<00:57,  1.52it/s]
 40%|████      | 58/144 [00:35<00:56,  1.51it/s]
 41%|████      | 59/144 [00:36<00:56,  1.52it/s]
 42%|████▏     | 60/144 [00:37<00:55,  1.52it/s]
 42%|████▏     | 61/144 [00:37<00:54,  1.51it/s]
 43%|████▎     | 62/144 [00:38<00:54,  1.51it/s]
 44%|████▍     | 63/144 [00:39<00:53,  1.52it/s]
 44%|████▍     | 64/144 [00:39<00:52,  1.52it/s]
 45%|████▌     | 65/144 [00:40<00:52,  1.52it/s]
 46%|████▌     | 66/144 [00:41<00:51,  1.52it/s]
 47%|████▋     | 67/144 [00:41<00:50,  1.52it/s]
 47%|████▋     | 68/144 [00:42<00:50,  1.52it/s]
 48%|████▊     | 69/144 [00:43<00:49,  1.52it/s]
 49%|████▊     | 70/144 [00:43<00:48,  1.52it/s]
 49%|████▉     | 71/144 [00:44<00:48,  1.52it/s]
 50%|█████     | 72/144 [00:45<00:47,  1.52it/s]
 51%|█████     | 73/144 [00:45<00:46,  1.51it/s]
 51%|█████▏    | 74/144 [00:46<00:46,  1.52it/s]
 52%|█████▏    | 75/144 [00:47<00:45,  1.52it/s]
 53%|█████▎    | 76/144 [00:47<00:44,  1.52it/s]
 53%|█████▎    | 77/144 [00:48<00:44,  1.52it/s]
 54%|█████▍    | 78/144 [00:49<00:43,  1.52it/s]
 55%|█████▍    | 79/144 [00:49<00:42,  1.52it/s]
 56%|█████▌    | 80/144 [00:50<00:42,  1.52it/s]
 56%|█████▋    | 81/144 [00:51<00:41,  1.52it/s]
 57%|█████▋    | 82/144 [00:51<00:40,  1.52it/s]
 58%|█████▊    | 83/144 [00:52<00:40,  1.51it/s]
 58%|█████▊    | 84/144 [00:53<00:39,  1.51it/s]
 59%|█████▉    | 85/144 [00:53<00:38,  1.51it/s]
 60%|█████▉    | 86/144 [00:54<00:38,  1.51it/s]
 60%|██████    | 87/144 [00:55<00:37,  1.52it/s]
 61%|██████    | 88/144 [00:55<00:36,  1.52it/s]
 62%|██████▏   | 89/144 [00:56<00:36,  1.52it/s]
 62%|██████▎   | 90/144 [00:57<00:35,  1.52it/s]
 63%|██████▎   | 91/144 [00:57<00:34,  1.52it/s]
 64%|██████▍   | 92/144 [00:58<00:34,  1.52it/s]
 65%|██████▍   | 93/144 [00:59<00:33,  1.51it/s]
 65%|██████▌   | 94/144 [00:59<00:33,  1.51it/s]
 66%|██████▌   | 95/144 [01:00<00:32,  1.52it/s]
 67%|██████▋   | 96/144 [01:01<00:31,  1.52it/s]
 67%|██████▋   | 97/144 [01:01<00:31,  1.52it/s]
 68%|██████▊   | 98/144 [01:02<00:30,  1.51it/s]
 69%|██████▉   | 99/144 [01:03<00:29,  1.52it/s]
 69%|██████▉   | 100/144 [01:03<00:29,  1.52it/s]
 70%|███████   | 101/144 [01:04<00:28,  1.52it/s]
 71%|███████   | 102/144 [01:04<00:27,  1.52it/s]
 72%|███████▏  | 103/144 [01:05<00:27,  1.51it/s]
 72%|███████▏  | 104/144 [01:06<00:26,  1.52it/s]
 73%|███████▎  | 105/144 [01:06<00:25,  1.51it/s]
 74%|███████▎  | 106/144 [01:07<00:25,  1.52it/s]
 74%|███████▍  | 107/144 [01:08<00:24,  1.52it/s]
 75%|███████▌  | 108/144 [01:08<00:23,  1.52it/s]
 76%|███████▌  | 109/144 [01:09<00:23,  1.52it/s]
 76%|███████▋  | 110/144 [01:10<00:22,  1.52it/s]
 77%|███████▋  | 111/144 [01:10<00:21,  1.52it/s]
 78%|███████▊  | 112/144 [01:11<00:21,  1.52it/s]
 78%|███████▊  | 113/144 [01:12<00:20,  1.52it/s]
 79%|███████▉  | 114/144 [01:12<00:19,  1.52it/s]
 80%|███████▉  | 115/144 [01:13<00:19,  1.52it/s]
 81%|████████  | 116/144 [01:14<00:18,  1.52it/s]
 81%|████████▏ | 117/144 [01:14<00:17,  1.52it/s]
 82%|████████▏ | 118/144 [01:15<00:17,  1.52it/s]
 83%|████████▎ | 119/144 [01:16<00:16,  1.52it/s]
 83%|████████▎ | 120/144 [01:16<00:15,  1.52it/s]
 84%|████████▍ | 121/144 [01:17<00:15,  1.52it/s]
 85%|████████▍ | 122/144 [01:18<00:14,  1.52it/s]
 85%|████████▌ | 123/144 [01:18<00:13,  1.52it/s]
 86%|████████▌ | 124/144 [01:19<00:13,  1.52it/s]
 87%|████████▋ | 125/144 [01:20<00:12,  1.52it/s]
 88%|████████▊ | 126/144 [01:20<00:11,  1.52it/s]
 88%|████████▊ | 127/144 [01:21<00:11,  1.52it/s]
 89%|████████▉ | 128/144 [01:22<00:10,  1.52it/s]
 90%|████████▉ | 129/144 [01:22<00:09,  1.52it/s]
 90%|█████████ | 130/144 [01:23<00:09,  1.52it/s]
 91%|█████████ | 131/144 [01:24<00:08,  1.52it/s]
 92%|█████████▏| 132/144 [01:24<00:07,  1.52it/s]
 92%|█████████▏| 133/144 [01:25<00:07,  1.52it/s]
 93%|█████████▎| 134/144 [01:26<00:06,  1.52it/s]
 94%|█████████▍| 135/144 [01:26<00:05,  1.52it/s]
 94%|█████████▍| 136/144 [01:27<00:05,  1.52it/s]
 95%|█████████▌| 137/144 [01:28<00:04,  1.52it/s]
 96%|█████████▌| 138/144 [01:28<00:03,  1.52it/s]
 97%|█████████▋| 139/144 [01:29<00:03,  1.52it/s]
 97%|█████████▋| 140/144 [01:30<00:02,  1.52it/s]
 98%|█████████▊| 141/144 [01:30<00:01,  1.52it/s]
 99%|█████████▊| 142/144 [01:31<00:01,  1.52it/s]
 99%|█████████▉| 143/144 [01:32<00:00,  1.52it/s]
100%|██████████| 144/144 [01:32<00:00,  1.52it/s]
100%|██████████| 144/144 [01:32<00:00,  1.55it/s]
100%|██████████| 40/40 [03:49<00:00,  5.75s/it]

This output was created using a different version of the model, lucataco/demofusion:6195e015.

Examples

View more examples

Run time and cost

This model costs approximately $0.0073 to run on Replicate, or 136 runs per $1, but this varies depending on your inputs. It is also open source and you can run it on your own computer with Docker.

This model runs on Nvidia A100 (80GB) GPU hardware. Predictions typically complete within 6 seconds. The predict time for this model varies significantly based on the inputs.

Readme

This is an implementation of DemoFusion. DemoFusion provides highres txt2img capabilities based on SDXL. See the demo example that showcases a txt to img run that provides an img in 1024x1024, 2048x2048, and 3076x3076 resolution in under 6min

Abstract

High-resolution image generation with Generative Artificial Intelligence (GenAI) has immense potential but, due to the enormous capital investment required for training, it is increasingly centralised to a few large corporations, and hidden behind paywalls. This paper aims to democratise high-resolution GenAI by advancing the frontier of high-resolution generation while remaining accessible to a broad audience. We demonstrate that existing Latent Diffusion Models (LDMs) possess untapped potential for higher-resolution image generation. Our novel DemoFusion framework seamlessly extends open-source GenAI models, employing Progressive Upscaling, Skip Residual, and Dilated Sampling mechanisms to achieve higher-resolution image generation. The progressive nature of DemoFusion requires more passes, but the intermediate results can serve as “previews”, facilitating rapid prompt iteration.

@article{du2023demofusion,
    title={DemoFusion: Democratising High-Resolution Image Generation With No $$$},
    author={Ruoyi Du and Dongliang Chang and Timothy M. Hospedales and Yi-Zhe Song and Zhanyu Ma},
    journal={arXiv},
    year={2023}
}