bwang0911
/

word-order-bge

Sentence Similarity

sentence-transformers

feature-extraction

Generated from Trainer

dataset_size:11002

loss:MultipleNegativesRankingLoss

text-embeddings-inference

Model card Files Files and versions

bwang0911 commited on Dec 3, 2024

Commit

c92b61f

·

verified ·

1 Parent(s): 424164c

Add new SentenceTransformer model

Files changed (2) hide show

README.md +14 -15
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -202,7 +202,6 @@ You can finetune this model on your own dataset.
 #### Non-Default Hyperparameters
 - `per_device_train_batch_size`: 256
-- `learning_rate`: 1e-05
 - `warmup_ratio`: 0.1
 - `fp16`: True
 - `batch_sampler`: no_duplicates
@@ -221,7 +220,7 @@ You can finetune this model on your own dataset.
 - `gradient_accumulation_steps`: 1
 - `eval_accumulation_steps`: None
 - `torch_empty_cache_steps`: None
-- `learning_rate`: 1e-05
 - `weight_decay`: 0.0
 - `adam_beta1`: 0.9
 - `adam_beta2`: 0.999
@@ -330,19 +329,19 @@ You can finetune this model on your own dataset.
 ### Training Logs
 | Epoch  | Step | Training Loss |
 |:------:|:----:|:-------------:|
-| 0.2273 | 10   | 1.8357        |
-| 0.4545 | 20   | 1.4057        |
-| 0.6818 | 30   | 0.949         |
-| 0.9091 | 40   | 0.8153        |
-| 1.1364 | 50   | 1.0746        |
-| 1.3636 | 60   | 0.8757        |
-| 1.5909 | 70   | 1.012         |
-| 1.8182 | 80   | 0.8014        |
-| 2.0455 | 90   | 0.6373        |
-| 2.2727 | 100  | 1.0644        |
-| 2.5    | 110  | 0.9805        |
-| 2.7273 | 120  | 0.7672        |
-| 2.9545 | 130  | 0.7059        |
 ### Framework Versions

 #### Non-Default Hyperparameters
 - `per_device_train_batch_size`: 256
 - `warmup_ratio`: 0.1
 - `fp16`: True
 - `batch_sampler`: no_duplicates
 - `gradient_accumulation_steps`: 1
 - `eval_accumulation_steps`: None
 - `torch_empty_cache_steps`: None
+- `learning_rate`: 5e-05
 - `weight_decay`: 0.0
 - `adam_beta1`: 0.9
 - `adam_beta2`: 0.999
 ### Training Logs
 | Epoch  | Step | Training Loss |
 |:------:|:----:|:-------------:|
+| 0.2273 | 10   | 1.6158        |
+| 0.4545 | 20   | 1.1681        |
+| 0.6818 | 30   | 0.8775        |
+| 0.9091 | 40   | 0.7628        |
+| 1.1364 | 50   | 1.0154        |
+| 1.3636 | 60   | 0.7048        |
+| 1.5909 | 70   | 0.7981        |
+| 1.8182 | 80   | 0.6322        |
+| 2.0455 | 90   | 0.4916        |
+| 2.2727 | 100  | 0.8441        |
+| 2.5    | 110  | 0.6697        |
+| 2.7273 | 120  | 0.5358        |
+| 2.9545 | 130  | 0.5111        |
 ### Framework Versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6c422c1bed0206693a9e1a9d6dec56e033544fe0df637fa09fb8d9561a37a9e
 size 437951328

 version https://git-lfs.github.com/spec/v1
+oid sha256:b94852c6a04ca84b6478f9b3af75a7bff023c8ae5ed7db43464461ca19e98ea0
 size 437951328