japanese-hubert-base-phoneme-ctc-v4

rinna/japanese-hubert-base ใ‚’ CTC ใงใฎๆ—ฅๆœฌ่ชž้Ÿณ็ด ่ช่ญ˜ใซใƒ•ใ‚กใ‚คใƒณใƒใƒฅใƒผใƒ‹ใƒณใ‚ฐใ—ใŸใƒขใƒ‡ใƒซใงใ™ใ€‚

v3 ใ‹ใ‚‰ใฎๅค‰ๆ›ด็‚น

  • ็™บ้Ÿณใฎๅ€™่ฃœใซๅฏพใ—ใฆ CTC loss ใฎ่จˆ็ฎ—ใ‚’่กŒใ†ใƒขใƒ‡ใƒซใ‚’ prj-beatrice/japanese-hubert-base-phoneme-ctc-v3 ใฎ 50k ใ‚นใƒ†ใƒƒใƒ—ๆ™‚็‚นใฎใƒขใƒ‡ใƒซใซๅค‰ๆ›ด
  • ๅญฆ็ฟ’ใƒ‡ใƒผใ‚ฟใ‹ใ‚‰้™คๅค–ใ™ใ‚‹ๆ–‡ใฎๆกไปถใ‚’ๆฌกใฎใ‚ˆใ†ใซๅค‰ๆ›ด
    • ใ€ŒใƒŸใƒฅใƒ‹ใ€ใ€Œใ‚ทใƒŸใƒฅใƒฌใ€ใ€Œ่กŒใฃใ€ใ€ŒๅŽŸๅ› ใ€ใ€Œๆบ€ๅ“กใ€ใ€Œๅบ—ๅ“กใ€ใ€Œๅ…จๅ“กใ€ใ€Œไผšๅ“กใ€ใ€Œๅ”ฏไธ€ใ€ใ€Œๆด—ๆฟฏๆฉŸใ€ใ€Œๅญฆ้คจใ€ใ€ŒๆŽๅ…‹ๅผทใ€ใ€Œๆ—…ๅฎขๆฉŸใ€ใ€Œ็š†ใ€ใ€Œๆœฌๅฝ“ใ€ใ€Œใƒ™ใƒƒใƒ‰ใ€ใ€Œใƒใƒชใ‚ฆใƒƒใƒ‰ใ€ใ€Œใƒฌใƒƒใƒ‰ใ€ใ€Œใƒ”ใƒฉใƒŸใƒƒใƒ‰ใ€ใ€Œใ‚นใ‚ฟใƒƒใƒ‰ใ€ใ€Œใ‚ญใƒƒใƒ‰ใ€ใ€Œใƒใ‚คใƒ–ใƒชใƒƒใƒ‰ใ€ใ€Œใƒใƒƒใƒ‰ใ€ใ€ŒPodใ€ใ€Œ๏ผฐ๏ฝ๏ฝ„ใ€ใ€Œใƒ‘ใƒƒใƒ‰ใ€ใ€ŒPadใ€ใ€Œ๏ผฐ๏ฝ๏ฝ„ใ€ใ€Œใ‚ญใƒฅใƒผใƒ”ใƒƒใƒ‰ใ€ใ€Œใ‚ฐใƒชใƒƒใƒ‰ใ€ใ€Œใ‚ดใƒƒใƒ‰ใ€ใ€Œใ‚ตใƒฉใƒ–ใƒฌใƒƒใƒ‰ใ€ใ€Œใƒใ‚ฐใƒ€ใƒƒใƒ‰ใ€ใ€ŒใƒฆใƒŠใ‚คใƒ†ใƒƒใƒ‰ใ€ใ€Œใƒ“ใƒ“ใƒƒใƒ‰ใ€ใ€Œใƒดใ‚ฃใƒดใ‚ฃใƒƒใƒ‰ใ€ใ€Œใƒใƒƒใ‚ฐใ€ใ€Œใƒ“ใƒƒใ‚ฐใ€ใ€Œใƒ€ใƒƒใ‚ฐใ€ใ€Œใƒ‰ใƒƒใ‚ฐใ€ใฎใ„ใšใ‚Œใ‹ใŒๅซใพใ‚ŒใŸๆ–‡ใฏๅญฆ็ฟ’ใƒ‡ใƒผใ‚ฟใ‹ใ‚‰้™คๅค–
    • ใ€Œใ™ใฟใพใ›ใ‚“ใ€ใŒๅซใพใ‚ŒใŸๆ–‡ใฎ 15/16ใ€ใ€Œ่กŒใใ€ใ€Œใฆใ„ใ‚‹ใ€ใŒๅซใพใ‚ŒใŸๆ–‡ใฎ 7/8ใ€ใ€Œ่”“ๅปถใ€ใ€Œไธ‡ๅ††ใ€ใŒๅซใพใ‚ŒใŸๆ–‡ใฎ 3/4ใ€ใ€Œใ‚‰ใชใ€ใŒๅซใพใ‚ŒใŸๆ–‡ใฎ 1/2 ใ‚’ๅญฆ็ฟ’ใƒ‡ใƒผใ‚ฟใ‹ใ‚‰้™คๅค–
    • ใ€Œๅใ€ใ€Œ0ใ€ใ€Œ๏ผใ€ใฎใ„ใšใ‚Œใ‹ใŒๅซใพใ‚ŒใŸๆ–‡ใฎใ†ใกใ€pyopenjtalk-plus ใงๆŽจๅฎšใ•ใ‚ŒใŸ็™บ้Ÿณใซใ€Œใ‚ธใƒฅใƒƒใ€ใŒๅซใพใ‚Œใ‚‹ใ‚‚ใฎใฏๅญฆ็ฟ’ใƒ‡ใƒผใ‚ฟใ‹ใ‚‰้™คๅค–
  • ่ชžใฎๆœซๅฐพใฎใ€Œใƒ†ใ‚ฃใ€ใ€Œใƒ‡ใ‚ฃใ€ใฏใใ‚Œใžใ‚Œใ€Œใƒ†ใ‚ฃใƒผใ€ใ€Œใƒ‡ใ‚ฃใƒผใ€ใซ็ฝฎๆ›
  • ใ€Œใ‚ฆใ‚งใ‚คใ‚ฟใƒผใ€ใ€Œใ‚ฆใ‚งใƒผใ‚ฟใƒผใ€ใ€Œใ‚ฆใ‚งใ‚คใƒˆใƒฌใ‚นใ€ใ€Œใ‚ฆใ‚งใƒผใƒˆใƒฌใ‚นใ€ใ€Œใ‚ฆใ‚งใƒ‡ใ‚ฃใƒณใ‚ฐใ€ใ€Œใ‚ฆใ‚งใ‚คใƒˆใƒชใƒ•ใƒ†ใ‚ฃใƒณใ‚ฐใ€ใ€Œใ‚ฆใ‚งใƒผใƒˆใƒชใƒ•ใƒ†ใ‚ฃใƒณใ‚ฐใ€ใ€Œใ‚ฆใ‚งใ‚คใƒˆใƒˆใƒฌใƒผใƒ‹ใƒณใ‚ฐใ€ใ€Œใ‚ฆใ‚งใƒผใƒˆใƒˆใƒฌใƒผใƒ‹ใƒณใ‚ฐใ€ใ€Œใ‚ฆใ‚งใ‚นใƒˆใ€ใ€Œใ‚ฆใ‚งใ‚นใƒˆใƒŸใƒณใ‚นใ‚ฟใƒผใ€ใ€Œใ‚ฆใ‚งใ‚นใ‚ฟใƒณใ€ใ€Œใ‚ฆใ‚งใƒƒใƒˆใƒ†ใ‚ฃใƒƒใ‚ทใƒฅใ€ใ€Œใ‚ฆใ‚งใƒƒใƒˆใ‚ทใƒผใƒˆใ€ใ€Œใ‚ฆใ‚งใƒƒใƒˆใ‚ฟใ‚ชใƒซใ€ใ€Œใ‚ฆใ‚งใƒƒใƒˆใ‚นใƒผใƒ„ใ€ใ€Œใƒ‡ใƒฉใ‚ฆใ‚งใ‚ขใ€ใซๅซใพใ‚Œใ‚‹ใ€Œใ‚ฆใ‚งใ€ใ‚’ใ€Œใ‚ฆใ‚จใ€ใซ็ฝฎๆ›
  • ใ€Œใƒใƒฃใƒณใƒ”ใ‚ชใƒณใ€ใฎ็™บ้Ÿณใ‚’ใ€Œใƒใƒฃใƒณใƒ”ใƒงใƒณใ€ใซๅค‰ๆ›ด
  • ใ€Œใใ‚Œใ„ใ€ใฎ็™บ้Ÿณใ‚’ใ€Œใ‚ญใƒฌใƒผใ€ใซๅค‰ๆ›ด
  • ใ€Œ๏ผกใ€ใ€Œ๏ผชใ€ใ€Œ๏ผซใ€ใฎ็™บ้Ÿณใ‚’ใใ‚Œใžใ‚Œใ€Œใ‚จใƒผใ€ใ€Œใ‚ธใ‚งใƒผใ€ใ€Œใ‚ฑใƒผใ€ใซๅค‰ๆ›ด
  • MeCab ใฎ N-best ใงๆŽจๅฎšใ—ใŸๅ€™่ฃœใงใ€Œ๏ผ˜ใ€ใฎ็™บ้ŸณใŒใ€Œใƒใƒƒใ€ใชใฉใจใชใฃใฆใ„ใ‚‹ๅ ดๅˆใซใ€ใใฎ้ƒจๅˆ†ใฎ็™บ้Ÿณใ‚’ใ€Œใƒใƒใ€ใซ็ฝฎๆ›ใ—ใŸใ‚‚ใฎใ‚‚ๅ€™่ฃœใซ่ฟฝๅŠ ใ™ใ‚‹
  • ๅญฆ็ฟ’ใซไฝฟ็”จใ™ใ‚‹ GPU ใ‚’ A100 ใ‹ใ‚‰ A6000 ใซๅค‰ๆ›ด
  • ้€”ไธญใงใ‚จใƒฉใƒผใŒๅ‡บใŸใŸใ‚ใ€110k ใ‚นใƒ†ใƒƒใƒ—ใงๅญฆ็ฟ’ใ‚’ไธญๆ–ญ

ใใฎไป–ใฎๆกไปถใฏ v3 ใจๅŒใ˜ใงใ™ใ€‚

Downloads last month
1,202
Safetensors
Model size
94.4M params
Tensor type
F32
ยท
Inference Providers NEW
This model isn't deployed by any Inference Provider. ๐Ÿ™‹ Ask for provider support

Model tree for prj-beatrice/japanese-hubert-base-phoneme-ctc-v4

Finetuned
(51)
this model

Dataset used to train prj-beatrice/japanese-hubert-base-phoneme-ctc-v4