Spaces:

MogensR
/

VideoBackgroundReplacer

Paused

App Files Files Community

MogensR commited on Aug 21

Commit

22b5156

1 Parent(s): dd7db87

Delete Configs

Browse files

Files changed (2) hide show

Configs/sam2_hiera_large.yaml +0 -108
Configs/sam2_hiera_tiny.yaml +0 -24

Configs/sam2_hiera_large.yaml DELETED Viewed

@@ -1,108 +0,0 @@
-# @package _global_
-# Model
-model:
-  _target_: sam2.modeling.sam2_base.SAM2Base
-  image_encoder:
-    _target_: sam2.modeling.backbones.image_encoder.ImageEncoder
-    scalp: 1
-    trunk:
-      _target_: sam2.modeling.backbones.hieradet.Hiera
-      embed_dim: 144
-      num_heads: 2
-      stages: [2, 6, 36, 4]
-      global_att_blocks: [23, 33, 43]
-      window_pos_embed_bkg_spatial_size: [7, 7]
-      window_spec: [8, 4, 16, 8]
-    neck:
-      _target_: sam2.modeling.backbones.image_encoder.FpnNeck
-      position_encoding:
-        _target_: sam2.modeling.position_encoding.PositionEmbeddingSine
-        num_pos_feats: 256
-        normalize: true
-        scale: null
-        temperature: 10000
-      d_model: 256
-      backbone_channel_list: [1152, 576, 288, 144]
-      fpn_top_down_levels: [2, 3]
-      fpn_interp_model: nearest
-  memory_attention:
-    _target_: sam2.modeling.memory_attention.MemoryAttention
-    d_model: 256
-    pos_enc_at_input: true
-    layer:
-      _target_: sam2.modeling.memory_attention.MemoryAttentionLayer
-      activation: relu
-      dim_feedforward: 2048
-      dropout: 0.1
-      pos_enc_at_attn: false
-      self_attention:
-        _target_: sam2.modeling.sam.transformer.RoPEAttention
-        rope_theta: 10000.0
-        feat_sizes: [64, 64]
-        embedding_dim: 256
-        num_heads: 1
-        downsample_rate: 1
-        dropout: 0.1
-      d_model: 256
-      pos_enc_at_cross_attn_keys: true
-      pos_enc_at_cross_attn_queries: false
-      cross_attention:
-        _target_: sam2.modeling.sam.transformer.RoPEAttention
-        rope_theta: 10000.0
-        feat_sizes: [64, 64]
-        rope_k_repeat: true
-        embedding_dim: 256
-        num_heads: 1
-        downsample_rate: 1
-        dropout: 0.1
-        kv_in_dim: 64
-    num_layers: 4
-  memory_encoder:
-    _target_: sam2.modeling.memory_encoder.MemoryEncoder
-    out_dim: 64
-    position_encoding:
-      _target_: sam2.modeling.position_encoding.PositionEmbeddingSine
-      num_pos_feats: 64
-      normalize: true
-      scale: null
-      temperature: 10000
-    mask_downsampler:
-      _target_: sam2.modeling.memory_encoder.MaskDownSampler
-      kernel_size: 3
-      stride: 2
-      padding: 1
-    fuser:
-      _target_: sam2.modeling.memory_encoder.Fuser
-      layer:
-        _target_: sam2.modeling.memory_encoder.CXBlock
-        dim: 256
-        kernel_size: 7
-        padding: 3
-        layer_scale_init_value: 1e-6
-        use_dwconv: true
-      num_layers: 2
-  num_maskmem: 7
-  image_size: 1024
-  sigmoid_scale_for_mem_enc: 20.0
-  sigmoid_bias_for_mem_enc: -10.0
-  use_mask_input_as_output_without_sam: true
-  directly_add_no_mem_embed: true
-  use_high_res_features_in_sam: true
-  multimask_output_in_sam: true
-  iou_prediction_use_sigmoid: true
-  use_obj_ptrs_in_encoder: true
-  add_tpos_enc_to_obj_ptrs: false
-  only_obj_ptrs_in_the_past_for_eval: true
-  pred_obj_scores: true
-  pred_obj_scores_mlp: true
-  fixed_no_obj_ptr: true
-  multimask_output_for_tracking: true
-  use_multimask_token_for_obj_ptr: true
-  multimask_min_pt_num: 0
-  multimask_max_pt_num: 1
-  use_mlp_for_obj_ptr_proj: true
-  compile_image_encoder: false

Configs/sam2_hiera_tiny.yaml DELETED Viewed

@@ -1,24 +0,0 @@
-# @package _global_
-model:
-  type: "sam2_hiera_tiny"
-  encoder_mode: "vit_t"
-  encoder_embed_dim: 192
-  encoder_depth: 12
-  encoder_num_heads: 3
-  prompt_embed_dim: 128
-  mask_decoder_embed_dim: 128
-  mask_decoder_depth: 2
-  mask_decoder_num_heads: 4
-  use_mask_tokens: true
-  use_box_tokens: true
-  checkpoint: "sam2_hiera_tiny.pt"
-  input_size: 256
-  patch_size: 16
-  drop_path_rate: 0.1
-  window_block_indices: [3, 7, 11]
-  mlp_ratio: 4.0
-  use_rel_pos_bias: true
-  global_attn_indices: [3, 7, 11]
-  decoder_use_mask_tokens: true
-  decoder_use_box_tokens: true
-  decoder_num_mask_tokens: 4