Overview

Parameters and Specifications

Metadata

Sample Data

Sample Metadata

Sample Transcription

Request Data

Overview

Our Conversational Data in Haryanvi offers comprehensive and authentic dialogues of Indians conversing in Haryanvi. This dataset features conversations that span a wide range of topics, including daily life, business, education, and more. It includes diverse speakers from different regions of India, capturing various accents and dialects to provide a rich linguistic resource.

The data is collected from natural, spontaneous conversations to ensure authenticity, and each conversation is accurately transcribed with annotations for contextual understanding. Additionally, we offer the flexibility to tailor the topics, conversations, and scenarios according to the specific needs of your company, ensuring that the dataset aligns perfectly with your requirements.

Parameters and Specifications

Data type

Conversational, Labelled

Format

Audio - .wav (44100Hz, 16-bit)

Unique Speakers

2

Platform Hardware

Mobile Device

Audio Tracks

Individual Speaker Stems (Stereo)

Metadata

For each recording the following metadata will be available

Age of speakers

Gender

Social Background

Geographical Location

Recording Platform

Topic

Scenario

Accent

Dialect

Sample Data

Individual Speaker Stems

General Conversation

Duration: 0:00

Waveform loading... 0%

0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00

Speaker 1

Audio - .wav (44100Hz, 16-bit)

Speaker 2

Audio - .wav (44100Hz, 16-bit)

1.0

0.5

0.0

-0.5

-1.0

1.0

0.5

0.0

-0.5

-1.0

Sample Metadata

Sample Transcription

You can request below to get access to our Transcription Guidelines.

Transcription Sample

Speaker 1

54, Male, Faridabad, Haryana

[
  {
    "index": 0,
    "start_time": 8.1,
    "end_time": 9.2,
    "text": "Hello, हाँ भाई!"
  },
  {
    "index": 1,
    "start_time": 11.1,
    "end_time": 12.4,
    "text": "राम-राम भाई, राम-राम, कौन?"
  },
  {
    "index": 2,
    "start_time": 13.1,
    "end_time": 13.4,
    "text": "अच्छा।"
  },
  {
    "index": 3,
    "start_time": 16.2,
    "end_time": 17.9,
    "text": "हाँ-हाँ, भाई, बिल्कुल!"
  },
  {
    "index": 4,
    "start_time": 23.4,
    "end_time": 24.1,
    "text": "इसा है"
  },
  {
    "index": 5,
    "start_time": 27,
    "end_time": 28.4,
    "text": "तो बहुत चीज आ गई, ख़ैर!"
  },
  {
    "index": 6,
    "start_time": 28.6,
    "end_time": 30,
    "text": "अब तो {ummm} [Confused]"
  },
  {
    "index": 7,
    "start_time": 31.2,
    "end_time": 37.5,
    "text": "इब यो vitamins की अलग आ गई, अर भई protien की अलग आ गई, नए अलग-अलग ‌‌डिब्याॅं के Mega Mass आ गया।"
  },
  {
    "index": 8,
    "start_time": 37.6,
    "end_time": 38.8,
    "text": "क्या-क्या आ गया, पता नहीं।"
  },
  {
    "index": 9,
    "start_time": "39.1",
    "end_time": "41",
    "text": "हमारे time मैं घी-दूध का खाणा था।"
  },
  {
    "index": 10,
    "start_time": 42.2,
    "end_time": 45.6,
    "text": "[inaudible] और बदाम थे, घी-दूध था, बदाम थे।"
  },
  {
    "index": 11,
    "start_time": 53,
    "end_time": 56.8,
    "text": "भाई, ऐसा है ना कि जो हमारे time की diet थी ना, वा boxing के लिए"
  },
  {
    "index": 12,
    "start_time": 57,
    "end_time": 57.7,
    "text": "fit नहीं थी।"
  },
  {
    "index": 13,
    "start_time": 59,
    "end_time": 60,
    "text": "उसमें strength"
  },
  {
    "index": 14,
    "start_time": 60.2,
    "end_time": 62.4,
    "text": "उसमें {st}, उसमें ताकत तो ज़्यादा थी"
  },
  {
    "index": 15,
    "start_time": 63.4,
    "end_time": 66.2,
    "text": "उस diet में ताकत बहुत ज़्यादा थी, मगर speed नहीं थी।"
  },
  {
    "index": 16,
    "start_time": 66.8,
    "end_time": 69.7,
    "text": "और यो यो यो जो game है नै, यो [trembling]"
  },
  {
    "index": 17,
    "start_time": 70.3,
    "end_time": 71.3,
    "text": "speed का game है।"
  },
  {
    "index": 18,
    "start_time": 72.9,
    "end_time": 74.8,
    "text": "हाँ, जबरदस्त एकदम [happy]"
  },
  {
    "index": 19,
    "start_time": 75.2,
    "end_time": 75.5,
    "text": "{uhh}"
  },
  {
    "index": 20,
    "start_time": 76,
    "end_time": 78.5,
    "text": "देखदे ई attack होणा ना, वो चीज़ है इसमें"
  },
  {
    "index": 21,
    "start_time": 79.4,
    "end_time": 82.8,
    "text": "तो ज्यादा, थोड़े से movement जब slow हो जै हैं नै।"
  },
  {
    "index": 22,
    "start_time": 83.4,
    "end_time": 84.7,
    "text": "तो फ़िर, फिर {umm}"
  },
  {
    "index": 23,
    "start_time": 84.9,
    "end_time": 87,
    "text": "आपका attack successful नहीं रहता भाई!"
  },
  {
    "index": 24,
    "start_time": 88.4,
    "end_time": 88.8,
    "text": "{ah}"
  },
  {
    "index": 25,
    "start_time": 93.9,
    "end_time": 98.2,
    "text": "देसी खाण-पीण में [inaudible] के लिए यूँ है की एक तो घी कम खावै"
  },
  {
    "index": 26,
    "start_time": 98.7,
    "end_time": 99.3,
    "text": "दूध"
  },
  {
    "index": 27,
    "start_time": 99.5,
    "end_time": 103,
    "text": "दूध थोड़ा सा {ah} ऐसा है कि मलाई तार के ही पीओ तो बढ़िया है।"
  },
  {
    "index": 28,
    "start_time": 104,
    "end_time": 104.6,
    "text": "{huhnn} [laughs]"
  },
  {
    "index": 29,
    "start_time": 105.6,
    "end_time": 108.3,
    "text": "{ahh}, fat कम से जितना fat, {eh}"
  },
  {
    "index": 30,
    "start_time": 108.6,
    "end_time": 110.4,
    "text": "वास्तव में त ये क्या है कि"
  },
  {
    "index": 31,
    "start_time": 110.8,
    "end_time": 112.2,
    "text": "यो genetic भी है, भाई।"
  },
  {
    "index": 32,
    "start_time": 112.3,
    "end_time": 113.7,
    "text": "ये [inaudible] वंशानुगत है"
  },
  {
    "index": 33,
    "start_time": 114.2,
    "end_time": 117.1,
    "text": "और माँ-बाप से भी आती है speed आपके बच्चे के {ahh}"
  },
  {
    "index": 34,
    "start_time": 117.2,
    "end_time": 117.9,
    "text": "सरीर में"
  },
  {
    "index": 35,
    "start_time": 119.8,
    "end_time": 124.2,
    "text": " ज़्यादा speedy अगर बच्चा हो ना, वो genetic भी उसपे बहुत depend करै "
  },
  {
    "index": 36,
    "start_time": 125.9,
    "end_time": 128.3,
    "text": "हाँ, भाई, कितना हाँ-हाँ कर, आ यही है। {ah}"
  },
  {
    "index": 37,
    "start_time": 134.7,
    "end_time": 136.3,
    "text": "देख run {r} runner"
  },
  {
    "index": 38,
    "start_time": 136.5,
    "end_time": 138.3,
    "text": "runner भी दो type के हों, भाई।"
  },
  {
    "index": 39,
    "start_time": 138.8,
    "end_time": 144.8,
    "text": "runner में एक तो ना ना, एक तो होता है छोटी {r} race वाला और एक होता है बडी race आला।"
  },
  {
    "index": 40,
    "start_time": 145.2,
    "end_time": 148,
    "text": "ठीक है, जो long, long, long race वाले होते हैं नाह"
  },
  {
    "index": 41,
    "start_time": 148.5,
    "end_time": 152.7,
    "text": "वो तो, वे तो मतलब, {uhh} जिसमें"
  },
  {
    "index": 42,
    "start_time": 152.9,
    "end_time": 155.7,
    "text": "जो slow होते हैं, वें ज्यादा बढ़िया कामयाब हों उसमें।"
  },
  {
    "index": 43,
    "start_time": 156.7,
    "end_time": 159.4,
    "text": "क्योंकि जितना आदमी में slow"
  },
  {
    "index": 44,
    "start_time": 159.6,
    "end_time": 161.1,
    "text": "fiber रहते हैं नै body में"
  },
  {
    "index": 45,
    "start_time": 162.4,
    "end_time": 167,
    "text": "तो उस low fiber रहणे से उसकी ए उसका stamina बढ जाता है।"
  },
  {
    "index": 46,
    "start_time": 167.1,
    "end_time": 169.8,
    "text": "और लंबे time तक काम कर सकता है थोड़ी speed ते।"
  },
  {
    "index": 47,
    "start_time": 175,
    "end_time": 175.4,
    "text": "आँह [breath heavily]"
  },
  {
    "index": 48,
    "start_time": 189.1,
    "end_time": 189.6,
    "text": "आछ्याह"
  },
  {
    "index": 49,
    "start_time": 204.7,
    "end_time": 206,
    "text": "बडी ख़ुराक में के है?"
  },
  {
    "index": 50,
    "start_time": 206.7,
    "end_time": 208.4,
    "text": "बडी ख़ुराक में कुछ नहीं है। [breathing]"
  },
  {
    "index": 51,
    "start_time": 208.6,
    "end_time": 212.8,
    "text": "Training चईये एक तो, और training के बाद एक तो ये juice-जास पीणा ज़रूरी है।"
  },
  {
    "index": 52,
    "start_time": 213.7,
    "end_time": 214.3,
    "text": "थोड़ा है ना"
  },
  {
    "index": 53,
    "start_time": 216.4,
    "end_time": 223.6,
    "text": "मौसमी से बढिया juice, कोई {ahh} मौसमी से बढ़िया कोई juice नहीं है पर गर्मियों में गन्ने के juice से यूँ होता है कि liver साफ़ रहता है।"
  },
  {
    "index": 54,
    "start_time": 225.2,
    "end_time": 226.9,
    "text": "यो बहुत ही बढ़िया है, अगर आप"
  },
  {
    "index": 55,
    "start_time": 227.3,
    "end_time": 229.3,
    "text": "गर्मियों में गन्ने का juice पीते हो तो बढ़िया है।"
  },
  {
    "index": 56,
    "start_time": 234,
    "end_time": 236.9,
    "text": "भाऐंठ cramp का तो मतलब यो है कि पानी नहीं पी रह्या।"
  },
  {
    "index": 57,
    "start_time": 237.5,
    "end_time": 242.1,
    "text": "cramp का सीधा मतलब यो है की {umm} वो आदमी sufficent पाणी नहीं पी रह्या।"
  },
  {
    "index": 58,
    "start_time": 243.6,
    "end_time": 247,
    "text": "उसको perfect पाणी की जरूरत है, दिन में, दिन भर मैं"
  },
  {
    "index": 59,
    "start_time": 247.4,
    "end_time": 250.1,
    "text": "लगातार, लगातार, थोड़ी-थोड़ी सी {ah} {ah}"
  },
  {
    "index": 60,
    "start_time": 250.3,
    "end_time": 253,
    "text": "time पर पाणी पीता रहे, cramp आणे का मतलब यो होता है।"
  },
  {
    "index": 61,
    "start_time": 254,
    "end_time": 254.6,
    "text": "body में"
  },
  {
    "index": 62,
    "start_time": 257.6,
    "end_time": 258.4,
    "text": "हाँ, हाँ, हाँ "
  },
  {
    "index": 63,
    "start_time": 261.9,
    "end_time": 266.4,
    "text": "ना {k} वा कोई बात नहीं, मगर उसमें क्या है, सबतै घणी cramp में पाणी की कमी रहती है body में।"
  },
  {
    "index": 64,
    "start_time": 267.9,
    "end_time": 271,
    "text": "हाँ, {um} पाणी की कमी की वजह से body में cramp आता है ज्यादा।"
  },
  {
    "index": 65,
    "start_time": 275.4,
    "end_time": 276.1,
    "text": "{hmm} {hmm}"
  },
  {
    "index": 66,
    "start_time": 279,
    "end_time": 281.1,
    "text": "stretching में ही muscle खींचता है ना, भाई।"
  },
  {
    "index": 67,
    "start_time": 281.9,
    "end_time": 284.4,
    "text": "जब stretching करता है, जभी muscle खींचता है आदमी का।"
  },
  {
    "index": 68,
    "start_time": 294.4,
    "end_time": 295.3,
    "text": "ऐसा है, देख!"
  },
  {
    "index": 69,
    "start_time": 295.6,
    "end_time": 297.2,
    "text": "जब भी exercise करता है नै"
  },
  {
    "index": 70,
    "start_time": 297.7,
    "end_time": 300.5,
    "text": "तो stretching exercise सबसे last म होती है।"
  },
  {
    "index": 71,
    "start_time": 301.1,
    "end_time": 303.3,
    "text": "अगर आप ने stretching exercise कर ली"
  },
  {
    "index": 72,
    "start_time": 303.6,
    "end_time": 305.2,
    "text": "उसके बाद आपकी exercise"
  },
  {
    "index": 73,
    "start_time": 305.5,
    "end_time": 307.6,
    "text": "stop होणी चईए, बंद हो जाणी चईए"
  }
]

Speaker 2

24, Male, Sonipat, Haryana

[
  {
    "index": 0,
    "start_time": 3.5,
    "end_time": 4.1,
    "text": "Hello"
  },
  {
    "index": 1,
    "start_time": 6.8,
    "end_time": 7.3,
    "text": "hello"
  },
  {
    "index": 2,
    "start_time": 9.5,
    "end_time": 10.4,
    "text": "Sir जी, राम-राम!"
  },
  {
    "index": 3,
    "start_time": 13,
    "end_time": 14.8,
    "text": "Sir जी, आप {puhh} पुराणे boxer रहे हो।"
  },
  {
    "index": 4,
    "start_time": 17.6,
    "end_time": 18.1,
    "text": "तो किम्में"
  },
  {
    "index": 5,
    "start_time": 18.3,
    "end_time": 21,
    "text": "पहले के किमी बताओ ना के खाण-पाण रह्या करै था।"
  },
  {
    "index": 6,
    "start_time": 23.1,
    "end_time": 24.2,
    "text": "जो {ee} इब"
  },
  {
    "index": 7,
    "start_time": 24.4,
    "end_time": 24.9,
    "text": "हाँ"
  },
  {
    "index": 8,
    "start_time": 41.9,
    "end_time": 43.3,
    "text": "हाँ, हाँ, घी-दूध के तो "
  },
  {
    "index": 9,
    "start_time": 46.3,
    "end_time": 50.8,
    "text": "इबी तो, इब भी है। कई-कई जगह पर, इब्की बार ना बेरो के stereotype लेण लाग गे हैं।"
  },
  {
    "index": 10,
    "start_time": 58.6,
    "end_time": 59.3,
    "text": "जैसे कि"
  },
  {
    "index": 11,
    "start_time": 66.7,
    "end_time": 67.6,
    "text": "आलसपण था।"
  },
  {
    "index": 12,
    "start_time": 71.6,
    "end_time": 72.3,
    "text": "चटकी कहाँ है?"
  },
  {
    "index": 13,
    "start_time": 83.2,
    "end_time": 83.5,
    "text": "हाँ!"
  },
  {
    "index": 14,
    "start_time": 87.7,
    "end_time": 91.1,
    "text": "तो अपणे उरे के है, देसी देसी खाणा-पीणा में जो मतलब चटकी दिखावै।"
  },
  {
    "index": 15,
    "start_time": 92.6,
    "end_time": 93.9,
    "text": "जो चटकी के लिए बढिया रहै।"
  },
  {
    "index": 16,
    "start_time": 103.9,
    "end_time": 104.7,
    "text": "Fat कम चढ़ै।"
  },
  {
    "index": 17,
    "start_time": 118.4,
    "end_time": 118.8,
    "text": "हाँ!"
  },
  {
    "index": 18,
    "start_time": 125.6,
    "end_time": 126.5,
    "text": "हाँ, यो तो है {avhh}"
  },
  {
    "index": 19,
    "start_time": 127.2,
    "end_time": 128.3,
    "text": "इब म्हारे घराँ मैं"
  },
  {
    "index": 20,
    "start_time": 128.5,
    "end_time": 131.9,
    "text": "म्हारे घराँ में लगभग सारे तो {r} runner type ही रहे हैं।"
  },
  {
    "index": 21,
    "start_time": 132.2,
    "end_time": 134,
    "text": "मेरा भाई है, वो भी runner ही है।"
  },
  {
    "index": 22,
    "start_time": 134.4,
    "end_time": 136.1,
    "text": "मैं भी runner की {r} तरह पतला ही हूँ"
  },
  {
    "index": 23,
    "start_time": 138.4,
    "end_time": 139.4,
    "text": "हाँ, egg white"
  },
  {
    "index": 24,
    "start_time": 145.1,
    "end_time": 146,
    "text": "हाँ, जैसे कि वो"
  },
  {
    "index": 25,
    "start_time": "155",
    "end_time": "174.8",
    "text": "हाँ,हाँ Sir जी, वो मेरे गैल ही है, मतलब यो {r} white switch fiber और red switch fiber रह है अलग-अलग"
  },
  {
    "index": 26,
    "start_time": 175.7,
    "end_time": 177,
    "text": "हाँ, मेरा माएँ वोई है"
  },
  {
    "index": 27,
    "start_time": 177.1,
    "end_time": 181.4,
    "text": "कि sir, height थोड़ी मतलब 5'7'' सै, और मैं लंबी distance आराम से भाग ल्यूँ हूँ।"
  },
  {
    "index": 28,
    "start_time": 182.3,
    "end_time": 185.2,
    "text": "तो मेरा बजन यो ही है एक सौ {ss} मल्लब"
  },
  {
    "index": 29,
    "start_time": 186,
    "end_time": 188.2,
    "text": "170 {ann} 70 के आस-पास height सै मेरी।"
  },
  {
    "index": 30,
    "start_time": 188.4,
    "end_time": 189.1,
    "text": "और"
  },
  {
    "index": 31,
    "start_time": 189.4,
    "end_time": 191.5,
    "text": "बजन सै 58 {क} किलो मतलब हाँ"
  },
  {
    "index": 32,
    "start_time": 191.8,
    "end_time": 194,
    "text": "long distance running के लिए perfect सरीर सै यो।"
  },
  {
    "index": 33,
    "start_time": 195.1,
    "end_time": 201.9,
    "text": "एक बारम थोड़ी ख़ुराक बता द्यो न जो अपणे उरे मिल्ज्य आराम तै क्योंकि थोड़ा ख़ुराक में दिक्कत आज्यै है। कोई कह दे है कि runner ने तो high ख़ुराक चईए।"
  },
  {
    "index": 34,
    "start_time": 202.5,
    "end_time": 203.4,
    "text": "बड़ी ख़ुराक चईए।"
  },
  {
    "index": 35,
    "start_time": 214.5,
    "end_time": 217.1,
    "text": "मौसमी वाला juice ठीक रहै, गंडे का juice ठीक है।"
  },
  {
    "index": 36,
    "start_time": 229.6,
    "end_time": 232.7,
    "text": "एक सब तै बड़ी problem आव है runner ने उनके bite {ae} ज़्यादा आवै है।"
  },
  {
    "index": 37,
    "start_time": 233,
    "end_time": 234.4,
    "text": "cramp बोलैं जिने English मैं।"
  },
  {
    "index": 38,
    "start_time": 242.7,
    "end_time": 243.3,
    "text": "अछ्याह!"
  },
  {
    "index": 39,
    "start_time": 253.8,
    "end_time": 257.1,
    "text": "हाँ, मैं जब training पे था ना तो cramp मतलब ज़्यादा आए करै थे तो"
  },
  {
    "index": 40,
    "start_time": 257.2,
    "end_time": 260.1,
    "text": "कोई कह दिया करै था कि भाई तेरे में कमजोरी आ री है, तू थोड़ी"
  },
  {
    "index": 41,
    "start_time": 260.5,
    "end_time": 261.2,
    "text": "ख़ुराक लिया कर।"
  },
  {
    "index": 42,
    "start_time": 267,
    "end_time": 267.4,
    "text": "अछ्या"
  },
  {
    "index": 43,
    "start_time": 271.8,
    "end_time": 274.7,
    "text": "हाँ, यो ही problem था कि cramp {curamp} आ गए, नस-नुस खींच गी"
  },
  {
    "index": 44,
    "start_time": 274.9,
    "end_time": 277.3,
    "text": "तो ज्यादा रह्या था ज्यादातर तो stretching के वक्त आवै है।"
  },
  {
    "index": 45,
    "start_time": 278.6,
    "end_time": 279.9,
    "text": "और {uh} यो भी तो है"
  },
  {
    "index": 46,
    "start_time": 281.5,
    "end_time": 282.4,
    "text": "हाँ, मतलब!"
  },
  {
    "index": 47,
    "start_time": 285.1,
    "end_time": 290.4,
    "text": "एक तो यो न्यूँ कह हैं न के नाम है के नाम आप stretching करो हो और gym करो हो तो दोनों में तै एक मतलब!"
  },
  {
    "index": 48,
    "start_time": 291,
    "end_time": 293.7,
    "text": "stretching कम करनी चईए, अगर जो वैसे power वाले हैं।"
  },
  {
    "index": 49,
    "start_time": 301.5,
    "end_time": 301.9,
    "text": "ठीक है, sir!"
  },
  {
    "index": 50,
    "start_time": 308.2,
    "end_time": 308.9,
    "text": "ठीक है, sir जी।"
  }
]

Request Data

You can file a request to get access to the data.