Zhang199
/

TinyLLaVA-Video-R1

Video-Text-to-Text

text-generation

Model card Files Files and versions

Metrics Training metrics Community

Zhang199 commited on Apr 13, 2025

Commit

30153bd

·

verified ·

1 Parent(s): 147cb3e

Update config.json

Files changed (1) hide show

config.json +6 -6

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/data/vlm/zxj/result/reasoning/TinyLLaVA-Video-Coldstart-nextqa-16",
   "architectures": [
     "TinyLlavaForConditionalGeneration"
   ],
@@ -10,7 +10,7 @@
   "ignore_index": -100,
   "image_aspect_ratio": "square",
   "image_token_index": -200,
-  "llm_model_name_or_path": "/data/vlm/zxj/checkpoints/Qwen2.5-3B",
   "model_type": "tinyllava",
   "num_queries": 512,
   "num_resampler_layers": 3,
@@ -18,7 +18,7 @@
   "resampler_hidden_size": 768,
   "text_config": {
     "_attn_implementation_autoset": true,
-    "_name_or_path": "/data/vlm/zxj/checkpoints/Qwen2.5-3B",
     "architectures": [
       "Qwen2ForCausalLM"
     ],
@@ -41,7 +41,7 @@
     "vocab_size": 151936
   },
   "tokenizer_model_max_length": 3072,
-  "tokenizer_name_or_path": "/data/vlm/zxj/checkpoints/Qwen2.5-3B",
   "tokenizer_padding_side": "right",
   "tokenizer_use_fast": false,
   "torch_dtype": "bfloat16",
@@ -58,7 +58,7 @@
     "image_size": 384,
     "intermediate_size": 4304,
     "layer_norm_eps": 1e-06,
-    "model_name_or_path": "/data/vlm/zxj/checkpoints/siglip-so400m-patch14-384",
     "model_name_or_path2": "",
     "model_type": "siglip_vision_model",
     "num_attention_heads": 16,
@@ -68,7 +68,7 @@
   "vision_feature_layer": -2,
   "vision_feature_select_strategy": "patch",
   "vision_hidden_size": 1152,
-  "vision_model_name_or_path": "/data/vlm/zxj/checkpoints/siglip-so400m-patch14-384",
   "vision_model_name_or_path2": "",
   "vocab_size": 151936
 }

 {
+  "_name_or_path": "Zhang199/TinyLLaVA-Video-Coldstart_NextQA_16",
   "architectures": [
     "TinyLlavaForConditionalGeneration"
   ],
   "ignore_index": -100,
   "image_aspect_ratio": "square",
   "image_token_index": -200,
+  "llm_model_name_or_path": "Qwen/Qwen2.5-3B",
   "model_type": "tinyllava",
   "num_queries": 512,
   "num_resampler_layers": 3,
   "resampler_hidden_size": 768,
   "text_config": {
     "_attn_implementation_autoset": true,
+    "_name_or_path": "Qwen/Qwen2.5-3B",
     "architectures": [
       "Qwen2ForCausalLM"
     ],
     "vocab_size": 151936
   },
   "tokenizer_model_max_length": 3072,
+  "tokenizer_name_or_path": "Qwen/Qwen2.5-3B",
   "tokenizer_padding_side": "right",
   "tokenizer_use_fast": false,
   "torch_dtype": "bfloat16",
     "image_size": 384,
     "intermediate_size": 4304,
     "layer_norm_eps": 1e-06,
+    "model_name_or_path": "google/siglip-so400m-patch14-384",
     "model_name_or_path2": "",
     "model_type": "siglip_vision_model",
     "num_attention_heads": 16,
   "vision_feature_layer": -2,
   "vision_feature_select_strategy": "patch",
   "vision_hidden_size": 1152,
+  "vision_model_name_or_path": "google/siglip-so400m-patch14-384",
   "vision_model_name_or_path2": "",
   "vocab_size": 151936
 }