Spaces:

yslan
/

LN3Diff_I23D

Running on Zero

App Files Files Community

NIRVANALAN commited on Aug 19, 2024

Commit

14db06e

1 Parent(s): f944436

update

Browse files

Files changed (11) hide show

app.py +7 -2
dit/__pycache__/dit_decoder.cpython-310.pyc +0 -0
dit/__pycache__/dit_i23d.cpython-310.pyc +0 -0
dit/__pycache__/dit_models_xformers.cpython-310.pyc +0 -0
dit/__pycache__/dit_trilatent.cpython-310.pyc +0 -0
dit/__pycache__/norm.cpython-310.pyc +0 -0
ldm/modules/__pycache__/attention.cpython-310.pyc +0 -0
logs/LSGM/inference/Objaverse/i23d/dit-L2/log.txt +294 -0
logs/LSGM/inference/Objaverse/i23d/dit-L2/progress.csv +0 -0
nsr/__pycache__/train_util_diffusion.cpython-310.pyc +0 -0
vit/__pycache__/vision_transformer.cpython-310.pyc +0 -0

app.py CHANGED Viewed

@@ -106,10 +106,15 @@ def check_input_image(input_image):
 def main(args):
     # args.rendering_kwargs = rendering_options_defaults(args)
-    # dist_util.setup_dist(args)
     logger.configure(dir=args.logdir)
     th.cuda.empty_cache()
@@ -207,7 +212,7 @@ def main(args):
                                     loss_class=None,
                                     data=data,
                                     eval_data=None,
-                                    **vars(args))
     @spaces.GPU(duration=200)
     def reconstruct_and_export(*args, **kwargs):

 def main(args):
+    os.environ['MASTER_ADDR'] = 'localhost'
+    os.environ['MASTER_PORT'] = '12355'
+    os.environ["CUDA_VISIBLE_DEVICES"] = "0"
+    os.environ["RANK"] = "0"
+    os.environ["WORLD_SIZE"] = "1"
     # args.rendering_kwargs = rendering_options_defaults(args)
+    dist_util.setup_dist(args)
     logger.configure(dir=args.logdir)
     th.cuda.empty_cache()
                                     loss_class=None,
                                     data=data,
                                     eval_data=None,
+                                    **args)
     @spaces.GPU(duration=200)
     def reconstruct_and_export(*args, **kwargs):

dit/__pycache__/dit_decoder.cpython-310.pyc ADDED Viewed

Binary file (5.97 kB). View file

dit/__pycache__/dit_i23d.cpython-310.pyc CHANGED Viewed

Binary files a/dit/__pycache__/dit_i23d.cpython-310.pyc and b/dit/__pycache__/dit_i23d.cpython-310.pyc differ

dit/__pycache__/dit_models_xformers.cpython-310.pyc CHANGED Viewed

Binary files a/dit/__pycache__/dit_models_xformers.cpython-310.pyc and b/dit/__pycache__/dit_models_xformers.cpython-310.pyc differ

dit/__pycache__/dit_trilatent.cpython-310.pyc CHANGED Viewed

Binary files a/dit/__pycache__/dit_trilatent.cpython-310.pyc and b/dit/__pycache__/dit_trilatent.cpython-310.pyc differ

dit/__pycache__/norm.cpython-310.pyc ADDED Viewed

Binary file (1.14 kB). View file

ldm/modules/__pycache__/attention.cpython-310.pyc CHANGED Viewed

Binary files a/ldm/modules/__pycache__/attention.cpython-310.pyc and b/ldm/modules/__pycache__/attention.cpython-310.pyc differ

logs/LSGM/inference/Objaverse/i23d/dit-L2/log.txt ADDED Viewed

	@@ -0,0 +1,294 @@

+Logging to ./logs/LSGM/inference/Objaverse/i23d/dit-L2/
+creating model and diffusion...
+creating 3DAE...
+length of vit_decoder.blocks: 24
+init pos_embed with sincos
+length of vit_decoder.blocks: 24
+ignore dim_up_mlp:  True
+AE(
+  (encoder): MVEncoderGSDynamicInp(
+    (conv_in): Conv2d(10, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+    (down): ModuleList(
+      (0): Module(
+        (block): ModuleList(
+          (0): ResnetBlock(
+            (norm1): GroupNorm(32, 64, eps=1e-06, affine=True)
+            (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 64, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+          )
+        )
+        (attn): ModuleList()
+        (downsample): Downsample(
+          (conv): Conv2d(64, 64, kernel_size=(3, 3), stride=(2, 2))
+        )
+      )
+      (1): Module(
+        (block): ModuleList(
+          (0): ResnetBlock(
+            (norm1): GroupNorm(32, 64, eps=1e-06, affine=True)
+            (conv1): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (nin_shortcut): Conv2d(64, 128, kernel_size=(1, 1), stride=(1, 1))
+          )
+        )
+        (attn): ModuleList()
+        (downsample): Downsample(
+          (conv): Conv2d(128, 128, kernel_size=(3, 3), stride=(2, 2))
+        )
+      )
+      (2): Module(
+        (block): ModuleList(
+          (0): ResnetBlock(
+            (norm1): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (conv1): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 256, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (nin_shortcut): Conv2d(128, 256, kernel_size=(1, 1), stride=(1, 1))
+          )
+        )
+        (attn): ModuleList()
+        (downsample): Downsample(
+          (conv): Conv2d(256, 256, kernel_size=(3, 3), stride=(2, 2))
+        )
+      )
+      (3): Module(
+        (block): ModuleList(
+          (0): ResnetBlock(
+            (norm1): GroupNorm(32, 256, eps=1e-06, affine=True)
+            (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 256, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+          )
+        )
+        (attn): ModuleList()
+      )
+    )
+    (mid): Module(
+      (block_1): ResnetBlock(
+        (norm1): GroupNorm(32, 256, eps=1e-06, affine=True)
+        (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+        (norm2): GroupNorm(32, 256, eps=1e-06, affine=True)
+        (dropout): Dropout(p=0.0, inplace=False)
+        (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+      )
+      (attn_1): SpatialTransformer3D(
+        (norm): GroupNorm(32, 256, eps=1e-06, affine=True)
+        (proj_in): Conv2d(256, 512, kernel_size=(1, 1), stride=(1, 1))
+        (transformer_blocks): ModuleList(
+          (0): BasicTransformerBlock3D(
+            (attn1): MemoryEfficientCrossAttention(
+              (to_q): Linear(in_features=512, out_features=512, bias=False)
+              (to_k): Linear(in_features=512, out_features=512, bias=False)
+              (q_norm): Identity()
+              (k_norm): Identity()
+              (to_v): Linear(in_features=512, out_features=512, bias=False)
+              (to_out): Sequential(
+                (0): Linear(in_features=512, out_features=512, bias=True)
+                (1): Dropout(p=0.0, inplace=False)
+              )
+            )
+            (ff): FeedForward(
+              (net): Sequential(
+                (0): GEGLU(
+                  (proj): Linear(in_features=512, out_features=4096, bias=True)
+                )
+                (1): Dropout(p=0.0, inplace=False)
+                (2): Linear(in_features=2048, out_features=512, bias=True)
+              )
+            )
+            (attn2): MemoryEfficientCrossAttention(
+              (to_q): Linear(in_features=512, out_features=512, bias=False)
+              (to_k): Linear(in_features=512, out_features=512, bias=False)
+              (q_norm): Identity()
+              (k_norm): Identity()
+              (to_v): Linear(in_features=512, out_features=512, bias=False)
+              (to_out): Sequential(
+                (0): Linear(in_features=512, out_features=512, bias=True)
+                (1): Dropout(p=0.0, inplace=False)
+              )
+            )
+            (norm1): LayerNorm((512,), eps=1e-05, elementwise_affine=True)
+            (norm2): LayerNorm((512,), eps=1e-05, elementwise_affine=True)
+            (norm3): LayerNorm((512,), eps=1e-05, elementwise_affine=True)
+          )
+        )
+        (proj_out): Conv2d(512, 256, kernel_size=(1, 1), stride=(1, 1))
+      )
+      (block_2): ResnetBlock(
+        (norm1): GroupNorm(32, 256, eps=1e-06, affine=True)
+        (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+        (norm2): GroupNorm(32, 256, eps=1e-06, affine=True)
+        (dropout): Dropout(p=0.0, inplace=False)
+        (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+      )
+    )
+    (norm_out): GroupNorm(32, 256, eps=1e-06, affine=True)
+    (conv_out): Conv2d(256, 24, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+  )
+  (decoder): RodinSR_256_fusionv6_ConvQuant_liteSR_dinoInit3DAttn_SD_B_3L_C_withrollout_withSD_D_ditDecoder(
+    (superresolution): ModuleDict(
+      (ldm_upsample): PatchEmbedTriplane(
+        (proj): Conv2d(12, 3072, kernel_size=(2, 2), stride=(2, 2), groups=3)
+        (norm): Identity()
+      )
+      (quant_conv): Conv2d(24, 24, kernel_size=(1, 1), stride=(1, 1), groups=3)
+      (conv_sr): Decoder(
+        (conv_in): Conv2d(1024, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+        (mid): Module(
+          (block_1): ResnetBlock(
+            (norm1): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+          )
+          (attn_1): MemoryEfficientAttnBlock(
+            (norm): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (q): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1))
+            (k): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1))
+            (v): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1))
+            (proj_out): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1))
+          )
+          (block_2): ResnetBlock(
+            (norm1): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            (norm2): GroupNorm(32, 128, eps=1e-06, affine=True)
+            (dropout): Dropout(p=0.0, inplace=False)
+            (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+          )
+        )
+        (up): ModuleList(
+          (0): Module(
+            (block): ModuleList(
+              (0): ResnetBlock(
+                (norm1): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (conv1): Conv2d(64, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 32, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (nin_shortcut): Conv2d(64, 32, kernel_size=(1, 1), stride=(1, 1))
+              )
+              (1): ResnetBlock(
+                (norm1): GroupNorm(32, 32, eps=1e-06, affine=True)
+                (conv1): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 32, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+              )
+            )
+            (attn): ModuleList()
+          )
+          (1): Module(
+            (block): ModuleList(
+              (0-1): 2 x ResnetBlock(
+                (norm1): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+              )
+            )
+            (attn): ModuleList()
+            (upsample): Upsample(
+              (conv): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            )
+          )
+          (2): Module(
+            (block): ModuleList(
+              (0): ResnetBlock(
+                (norm1): GroupNorm(32, 128, eps=1e-06, affine=True)
+                (conv1): Conv2d(128, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (nin_shortcut): Conv2d(128, 64, kernel_size=(1, 1), stride=(1, 1))
+              )
+              (1): ResnetBlock(
+                (norm1): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 64, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+              )
+            )
+            (attn): ModuleList()
+            (upsample): Upsample(
+              (conv): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            )
+          )
+          (3): Module(
+            (block): ModuleList(
+              (0-1): 2 x ResnetBlock(
+                (norm1): GroupNorm(32, 128, eps=1e-06, affine=True)
+                (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+                (norm2): GroupNorm(32, 128, eps=1e-06, affine=True)
+                (dropout): Dropout(p=0.0, inplace=False)
+                (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+              )
+            )
+            (attn): ModuleList()
+            (upsample): Upsample(
+              (conv): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+            )
+          )
+        )
+        (norm_out): GroupNorm(32, 32, eps=1e-06, affine=True)
+        (conv_out): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
+      )
+    )
+    (vit_decoder): DiT2(
+      (blocks): ModuleList(
+        (0-23): 24 x DiTBlock2(
+          (norm1): LayerNorm((1024,), eps=1e-06, elementwise_affine=False)
+          (norm2): LayerNorm((1024,), eps=1e-06, elementwise_affine=False)
+          (attn): MemEffAttention(
+            (qkv): Linear(in_features=1024, out_features=3072, bias=True)
+            (attn_drop): Dropout(p=0.0, inplace=False)
+            (proj): Linear(in_features=1024, out_features=1024, bias=True)
+            (proj_drop): Dropout(p=0.0, inplace=False)
+            (q_norm): Identity()
+            (k_norm): Identity()
+          )
+          (mlp): FusedMLP(
+            (mlp): Sequential(
+              (0): Linear(in_features=1024, out_features=4096, bias=False)
+              (1): FusedDropoutBias(
+                (activation_pytorch): GELU(approximate='none')
+              )
+              (2): Linear(in_features=4096, out_features=1024, bias=False)
+              (3): FusedDropoutBias(
+                (activation_pytorch): Identity()
+              )
+            )
+          )
+          (adaLN_modulation): Sequential(
+            (0): SiLU()
+            (1): Linear(in_features=1024, out_features=6144, bias=True)
+          )
+        )
+      )
+    )
+    (triplane_decoder): Triplane(
+      (renderer): ImportanceRenderer(
+        (ray_marcher): MipRayMarcher2()
+      )
+      (ray_sampler): PatchRaySampler()
+      (decoder): OSGDecoder(
+        (net): Sequential(
+          (0): FullyConnectedLayer(in_features=32, out_features=64, activation=linear)
+          (1): Softplus(beta=1.0, threshold=20.0)
+          (2): FullyConnectedLayer(in_features=64, out_features=4, activation=linear)
+        )
+      )
+    )
+    (decoder_pred): None
+  )
+)
+create dataset
+joint_denoise_rec_model enables AMP to accelerate training

logs/LSGM/inference/Objaverse/i23d/dit-L2/progress.csv ADDED Viewed

File without changes

nsr/__pycache__/train_util_diffusion.cpython-310.pyc CHANGED Viewed

Binary files a/nsr/__pycache__/train_util_diffusion.cpython-310.pyc and b/nsr/__pycache__/train_util_diffusion.cpython-310.pyc differ

vit/__pycache__/vision_transformer.cpython-310.pyc CHANGED Viewed

Binary files a/vit/__pycache__/vision_transformer.cpython-310.pyc and b/vit/__pycache__/vision_transformer.cpython-310.pyc differ