#-*- coding: utf-8 -*- #fetching the needed library modules import csv, subprocess, time, pywikibot, re WAIT_TIME = 15 with open('123.csv', 'r') as csvfile: reader = csv.reader(csvfile,delimiter="~") for row in reader: #removing the first line of the csv # subprocess.call("sed -i `` 1d 123.csv",shell=True) wiktHeader = row[0]#.decode('utf-8') print (wiktHeader) site1 = pywikibot.Site('ta', 'wiktionary') page = pywikibot.Page(site1, wiktHeader) # print (page.text) page.text = page.text #checking categories if not placing categories findWord1 = '.'#.decode('utf-8') findCat1 = '[[பகுப்பு:ஆங்கிலம்-புள்ளியுள்ள தலைப்புகள்]]'#.decode('utf-8') if findWord1 in wiktHeader: if not findCat1 in page.text: page.text = page.text + '\n' + findCat1 findWord2 = '('#.decode('utf-8') findCat2 = '[[பகுப்பு:ஆங்கிலம்-வளைவுக்குறியுள்ள தலைப்புகள்]]'#.decode('utf-8') if findWord2 in wiktHeader: if not findCat2 in page.text: page.text = page.text + '\n' + findCat2 findWord3 = ')'#.decode('utf-8') findCat3 = '[[பகுப்பு:ஆங்கிலம்-வளைவுக்குறியுள்ள தலைப்புகள்]]'#.decode('utf-8') if findWord3 in wiktHeader: if not findCat3 in page.text: page.text = page.text + '\n' + findCat3 findWord4 = '/'#.decode('utf-8') findCat4 = '[[பகுப்பு:ஆங்கிலம்-முன்சாய்வுக்கோடுள்ள தலைப்புகள்]]'#.decode('utf-8') if findWord4 in wiktHeader: if not findCat4 in page.text: page.text = page.text + '\n' + findCat4 findWord5 = '-'#.decode('utf-8') findCat5 = '[[பகுப்பு:ஆங்கிலம்-சொல்லிடையிணைப்புக்குறியுள்ள தலைப்புகள்]]'#.decode('utf-8') if findWord5 in wiktHeader: if not findCat5 in page.text: page.text = page.text + '\n' + findCat5 findWord6 = 'இணையப் பல்கலைக்கழக அகரமுதலியில்'#.decode('utf-8') findCat6 = '[[பகுப்பு:ஆங்கிலம்-கொடை-2010-தஇகக-சுந்தர் தானியங்கி]]'#.decode('utf-8') if findWord6 in page.text: if not findCat6 in page.text: page.text = page.text + '\n' + findCat6 findWord7 = '_'#.decode('utf-8') findCat7 = '[[பகுப்பு:ஆங்கிலம்-கூட்டுச்சொல் தலைப்புகள்]]'#.decode('utf-8') if findWord7 in page.text: if not findCat7 in page.text: page.text = page.text + '\n' + findCat7 # findWord7 = "*[http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch="+wiktHeader+"&OptSearch=&id=All தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியிலில் "+wiktHeader+"]" #removing unwanted words, templates #.replace(s,r) # s = ''#.decode('utf-8') # r = ''#.decode('utf-8') s1 = '==ஆங்கிலம்==\n'#.decode('utf-8') r1 = '=={{மொழி|en}}==\n'#.decode('utf-8') s2 = ';பலுக்கல்\n\n'#.decode('utf-8') r2 = ''#.decode('utf-8') s3 = '* {{audio|en-us-{{PAGENAME}}.ogg|பலுக்கல் (ஐ.அ)}}'#.decode('utf-8') r3 = ''#.decode('utf-8') s4 = '==உசாத்துணை=='#.decode('utf-8') r4 = '\n{{ஆதாரங்கள்-தஇககலை}}'#.decode('utf-8') s5 = '\n* தமிழ்'#.decode('utf-8') r5 = ''#.decode('utf-8') s6 = '* தமிழ்'#.decode('utf-8') r6 = '\n{{ஆதாரங்கள்-தஇககலை}}'#.decode('utf-8') s7 = "*"#.decode('utf-8') r7 = "#"#.decode('utf-8') s8 = '}}=={{'#.decode('utf-8') r8 = '}}==\n{{'#.decode('utf-8') s9 = '].'#.decode('utf-8') r9 = ']'#.decode('utf-8') s10 = '{{ஒலிப்பு1}}\n'#.decode('utf-8') r10 = ''#.decode('utf-8') s11 = ":*{{உச்சரிப்புதவி|'''*'''}}{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}\n"#.decode('utf-8') r11 = ""#.decode('utf-8') s12 = '{{சென்னைப் பேரகரமுதலி}}'#.decode('utf-8') r12 = ''#.decode('utf-8') s13 = "'''{{PAGENAME}}''', {{பெயர்ச்சொல்}}."#.decode('utf-8') r13 = "{{பெயர்ச்சொல்-பகுப்பு|en}}"#.decode('utf-8') s14 = ':*'#.decode('utf-8') r14 = '#'#.decode('utf-8') s15 = "#{{உச்சரிப்புதவி|'''*'''}}{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}\n"#.decode('utf-8') r15 = ""#.decode('utf-8') s16 = '# '#.decode('utf-8') r16 = '#'#.decode('utf-8') s17 = ":*{{உச்சரிப்புதவி|'''/æ.læˈkɑː(ɹ)t/'''}}{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}\n"#.decode('utf-8') r17 = "உச்சரிப்புதவி|'''/æ.læˈkɑː(ɹ)t/'''}}{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}\n"#.decode('utf-8') s18 = ':*{{உச்சரிப்புதவி|'#.decode('utf-8') r18 = ''#.decode('utf-8') s19 = "'''*'''}}\n"#.decode('utf-8') r19 = ''#.decode('utf-8') s20 = '{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}\n'#.decode('utf-8') r20 = ''#.decode('utf-8') s21 = "'''#'''}}\n"#.decode('utf-8') r21 = ''#.decode('utf-8') s22 = ':#{{உச்சரிப்புதவி|'#.decode('utf-8') r22 = ''#.decode('utf-8') s23 = "'''#'''}}"#.decode('utf-8') r23 = ""#.decode('utf-8') s24 = ':#'#.decode('utf-8') r24 = '#'#.decode('utf-8') s25 = "{{உச்சரிப்புதவி|}}{{ஆங்பலு}} ''ஒலிப்பு:''"#.decode('utf-8') r25 = ""#.decode('utf-8') s26 = '{{ஆங்-சொற்பிற}}'#.decode('utf-8') r26 = ''#.decode('utf-8') s27 = '#['#.decode('utf-8') r27 = '*['#.decode('utf-8') s28 = '[[படிமம்:'#.decode('utf-8') r28 = '[[File:'#.decode('utf-8') s29 = ';[[பலுக்கல்]] {{audio|en-us-{{PAGENAME}}.ogg|(ஐ.அ)}}'#.decode('utf-8') r29 = ''#.decode('utf-8') s30 = ';பலுக்கல் {{audio|en-us-{{PAGENAME}}.ogg|(ஐ.அ)}}'#.decode('utf-8') r30 = ''#.decode('utf-8') s31 = '[[பகுப்பு:ஆங்கிலம்-சொல்லிடையிணைப்புக்குறி உள்ளவை]]' r31 = ''#.decode('utf-8') s32 = '*[['#.decode('utf-8') r32 = '#[['#.decode('utf-8') s33 = '===பலுக்கல்===\n\n'#.decode('utf-8') r33 = ''#.decode('utf-8') s34 = '{{ஆங்கில ஆதாரங்கள்|தமிழிணையக் கல்விக்கழக, கலைச்சொல் [[பேரகரமுதலி]]யின் {{த.இ.க.க.சொற்தேடல்பக்கம்}}}}'#.decode('utf-8') r34 = '{{ஆதாரங்கள்-தஇககலை}}'#.decode('utf-8') # s35 = findWord7 #.decode('utf-8') # r35 = "{{ஆதாரங்கள்-தஇககலை}}"#.decode('utf-8') s36 = '[http://ta.wiktionary.org/wiki/%E0%AE%B5%E0%AE%BF%E0%AE%95%E0%AF%8D%E0%AE%9A%E0%AE%A9%E0%AE%B0%E0%AE%BF:%E0%AE%85%E0%AE%9F%E0%AE%BF%E0%AE%AA%E0%AF%8D%E0%AE%AA%E0%AE%9F%E0%AF%88_%E0%AE%86%E0%AE%99%E0%AF%8D%E0%AE%95%E0%AE%BF%E0%AE%B2%E0%AE%9A%E0%AF%8D_%E0%AE%9A%E0%AF%8A%E0%AE%B1%E0%AF%8D%E0%AE%95%E0%AE%B3%E0%AF%8D விக்சனரி:அடிப்படை ஆங்கிலச் சொற்களுள்ளப் பக்கம்]'#.decode('utf-8') r36 = '[[விக்சனரி:அடிப்படை ஆங்கிலச் சொற்கள்]]'#.decode('utf-8') s37 = '{{ஆதாரங்கள்-தஇககலை}}\n{{ஆதாரங்கள்-தஇககலை}}' #.decode('utf-8') r37 = '{{ஆதாரங்கள்-தஇககலை}}'#.decode('utf-8') s38 = '{{த.இ.க.க.}}'#.decode('utf-8') r38 = ''#.decode('utf-8') s39 = '[[பகுப்பு:ஆங்கிலம்-வளைவுக்குறியுள்ள சொற்கள்]]'#.decode('utf-8') r39 = ''#.decode('utf-8') s40 = '[[பகுப்பு:ஆங்கிலம்-முன்சாய்வுக்கோடுள்ள சொற்கள்]]'#.decode('utf-8') r40 = ''#.decode('utf-8')[[பகுப்பு:ஆங்கிலம்-முன்சாய்வுக்கோடுள்ள தலைப்புகள்]] s41 = '[[பகுப்பு:ஆங்கிலம்-புள்ளியுள்ள சொற்கள்]]'#.decode('utf-8') r41 = ''#.decode('utf-8') s42 = '{{ஆதாரங்கள்-மொழி|ta}}'#.decode('utf-8') r42 = ''#.decode('utf-8') s43 = '===={{ஆங்தலை}}===='#.decode('utf-8') r43 = '=={{மொழி|en}}=='#.decode('utf-8') s44 = '{{உச்சரிப்புதவி|}}{{ஆங்பலு}} '#.decode('utf-8') r44 = ''#.decode('utf-8') s45 = '{{இலக்கியமை}}'#.decode('utf-8') r45 = ''#.decode('utf-8') s46 = '----'#.decode('utf-8') r46 = ''#.decode('utf-8') s47 = '{[[ஆதாரம்|ஆதாரங்கள்]] - [http://en.wiktionary.org/wiki/zero_tolerance ஆங்கில விக்சனரி]}'#.decode('utf-8') r47 = ''#.decode('utf-8') s48 = '{{நீலஅடிக்கோடு}}'#.decode('utf-8') r48 = ''#.decode('utf-8') s49 = '{{ஆங்-பலுகுறிஒலி| #}}'#.decode('utf-8') r49 = ''#.decode('utf-8') # s5 = ''#.decode('utf-8') # r5 = ''#.decode('utf-8') # s5 = ''#.decode('utf-8') # r5 = ''#.decode('utf-8') # s5 = ''#.decode('utf-8') # r5 = ''#.decode('utf-8') existingContent = page.text.replace(s1,r1).replace(s2,r2).replace(s3,r3).replace(s4,r4).replace(s5,r5).replace(s6,r6).replace(s7,r7).replace(s8,r8).replace(s9,r9).replace(s10,r10).replace(s11,r11).replace(s12,r12).replace(s13,r13).replace(s14,r14).replace(s15,r15).replace(s16,r16).replace(s17,r17).replace(s18,r18).replace(s19,r19).replace(s20,r20).replace(s21,r21).replace(s22,r22).replace(s23,r23).replace(s24,r24).replace(s25,r25).replace(s26,r26).replace(s27,r27).replace(s28,r28).replace(s29,r29).replace(s30,r30).replace(s31,r31).replace(s32,r32).replace(s33,r33).replace(s34,r34).replace(s36,r36).replace(s37,r37).replace(s38,r38).replace(s39,r39).replace(s40,r40).replace(s41,r41).replace(s42,r42).replace(s43,r43).replace(s44,r44).replace(s45,r45).replace(s46,r46).replace(s47,r47).replace(s48,r48).replace(s49,r49)#.replace(s5,r5) removeLine1 = " இணையப் பல்கலைக்கழக அகரமுதலியில்\s*\[.*\]"#.decode('utf-8') modifiedContent1 = re.sub(removeLine1, '' , existingContent) # print(modifiedContent1) # removeLine2 = "*\s*\[.*\]""#.decode('utf-8') # modifiedContent1 = re.sub(removeLine2, '' , existingContent) # print(modifiedContent1) catSummary = '''-[[பகுப்பு:அறுபட்ட கோப்பு இணைப்புகள் உள்ள பக்கங்கள்|அறுபட்ட இணைப்பு நீக்கம்]], + [[பகுப்பு:ஆங்கிலம்-சொல்லிடையிணைப்புக்குறியுள்ள தலைப்புகள்|பகுப்பு மாற்றம்]]'''#.decode('utf-8') # catSummary = '''-[[பகுப்பு:அறுபட்ட கோப்பு இணைப்புகள் உள்ள பக்கங்கள்|அறுபட்ட இணைப்பு நீக்கம்]], + [[பகுப்பு:ஆங்கிலம்-கொடை-2010-தஇகக-சுந்தர் தானியங்கி|பகுப்பு இணைப்பு]]'''#.decode('utf-8') page.text = modifiedContent1.strip() print (modifiedContent1) page.save(summary = catSummary) time.sleep(WAIT_TIME) #to get the wiktHeader and its meaning without the wiki syntex #.replace(sd,rd) # sd = ''#.decode('utf-8') # rd = ''#.decode('utf-8') sd1 = '=={{மொழி|en}}=='#.decode('utf-8') rd1 = ''#.decode('utf-8') sd2 = "\n'''{{PAGENAME}}'''\n"#.decode('utf-8') rd2 = ''#.decode('utf-8') sd3 = '\n*'#.decode('utf-8') rd3 = '~*'#.decode('utf-8') sd4 = '\n#'#.decode('utf-8') rd4 = '#'#.decode('utf-8') sd5 = '\n:'#.decode('utf-8') rd5 = '~:'#.decode('utf-8') sd6 = '\n*:'#.decode('utf-8') rd6 = ''#.decode('utf-8') sd7 = '[[பகுப்பு'#.decode('utf-8') rd7 = 'பகுப்பு'#.decode('utf-8') sd8 = '{{ஆதாரங்கள்-தஇககலை}}'#.decode('utf-8') rd8 = ''#.decode('utf-8') sd9 = '{{படம்|'#.decode('utf-8') rd9 = '~{{படம்|'#.decode('utf-8') sd10 = '}}\n'#.decode('utf-8') rd10 = '}}'#.decode('utf-8') sd11 = '}}\n\n'#.decode('utf-8') rd11 = '}}'#.decode('utf-8') sd12 = '}}\n\n\n'#.decode('utf-8') rd12 = '}}'#.decode('utf-8') sd13 = '}}\n\n\n\n'#.decode('utf-8') rd13 = '}}'#.decode('utf-8') sd14 = '}}\n\n\n\n\n'#.decode('utf-8') rd14 = '}}'#.decode('utf-8'){{ஒலிப்பு1}} sd15 = '{{பெயர்ச்சொல்-பகுப்பு|en}}'#.decode('utf-8') rd15 = ''#.decode('utf-8') sd16 = '{{=ஆங்=}}'#.decode('utf-8') rd16 = ''#.decode('utf-8') sd17 = '{{பொருள்}}'#.decode('utf-8') rd17 = ''#.decode('utf-8') sd18 = '{{விளக்கம்}}'#.decode('utf-8') rd18 = ''#.decode('utf-8') sd19 = ':*{{ஆங்கிலம்-சொற்பிறப்பியல்}}'#.decode('utf-8') rd19 = ''#.decode('utf-8') sd20 = '{{பயன்பாடு}}'#.decode('utf-8') rd20 = ''#.decode('utf-8') sd21 = ':*...'#.decode('utf-8') rd21 = ''#.decode('utf-8') sd22 = '#...'#.decode('utf-8') rd22 = ''#.decode('utf-8') sd23 = '~#{{ஆங்கிலம்-சொற்பிறப்பியல்}}~'#.decode('utf-8') rd23 = ''#.decode('utf-8') sd24 = '~\n{{ஆங்கில ஆதாரங்கள்|*}}'#.decode('utf-8') rd24 = ''#.decode('utf-8') sd25 = '#...'#.decode('utf-8') rd25 = ''#.decode('utf-8') sd26 = '#...'#.decode('utf-8') rd26 = ''#.decode('utf-8') sd27 = '~'#.decode('utf-8') rd27 = ''#.decode('utf-8') sd28 = '~'#.decode('utf-8') rd28 = ''#.decode('utf-8') sd29 = "'''{{PAGENAME}}'''"#.decode('utf-8') rd29 = ""#.decode('utf-8') sd30 = '}}\n'#.decode('utf-8') rd30 = '}}'#.decode('utf-8') sd31 = '#'#.decode('utf-8') rd31 = '~#'#.decode('utf-8') sd32 = ':~#{{'#.decode('utf-8') rd32 = ''#.decode('utf-8') sd33 = '{{audio|En-us-{{PAGENAME}}.ogg| [[File:Flag of the United States.svg|24px]]}}'#.decode('utf-8') rd33 = ''#.decode('utf-8')/small>}} sd34 = '/small>}}'#.decode('utf-8') rd34 = '/small>'#.decode('utf-8') sd35 = 'உச்சரிப்புதவி|'#.decode('utf-8') rd35 = ''#.decode('utf-8')~:~# sd36 = '~:~#'#.decode('utf-8') rd36 = '~#'#.decode('utf-8') sd37 = '{{ஆங்கில ஆதாரங்கள்|~#}}'#.decode('utf-8') rd37 = ''#.decode('utf-8') sd38 = '~:'#.decode('utf-8') rd38 = ''#.decode('utf-8') sd39 = '~:'#.decode('utf-8') rd39 = ''#.decode('utf-8') sd40 = '{{ஆங்கில ஆதாரங்கள்|}}'#.decode('utf-8') rd40 = ''#.decode('utf-8') sd41 = '{{சென்னைபேரகரமுதலி}}'#.decode('utf-8') rd41 = ''#.decode('utf-8') sd42 = '{{ஆங்கில ஆதாரங்கள்}}'#.decode('utf-8') rd42 = ''#.decode('utf-8') sd43 = "'''*'''"#.decode('utf-8') rd43 = ''#.decode('utf-8') sd44 = ''#.decode('utf-8') rd44 = ''#.decode('utf-8') sd45 = ''#.decode('utf-8') rd45 = ''#.decode('utf-8') sd46 = '~:~#{{ஆங்கிலம்-சொற்பிறப்பியல்}}~:'#.decode('utf-8') rd46 = ''#.decode('utf-8') sd47 = '\n='#.decode('utf-8') rd47 = '='#.decode('utf-8') sd48 = '=\n'#.decode('utf-8') rd48 = '='#.decode('utf-8') sd49 = '{{நீலஅடிக்கோடு}}'#.decode('utf-8') rd49 = ''#.decode('utf-8') sd50 = '{{ஆங்ஆதாரம்}}'#.decode('utf-8') rd50 = ''#.decode('utf-8') sd51 = '~#\n{{இலக்கியமை}}~#'#.decode('utf-8') rd51 = ''#.decode('utf-8') sd52 = '\n\n\n~'#.decode('utf-8') rd52 = '~'#.decode('utf-8') sd53 = '== {{மொழி|en}} ==\n'#.decode('utf-8') rd53 = ''#.decode('utf-8') sd54 = '{{PAGENAME}}{{பெ}}'#.decode('utf-8') rd54 = ''#.decode('utf-8') sd55 = '{{பெ}}'#.decode('utf-8') rd55 = ''#.decode('utf-8') sd56 = '\n\n\n\n{{'#.decode('utf-8') rd56 = '{{'#.decode('utf-8') sd57 = '\n~#\n~#'#.decode('utf-8') rd57 = '~#~#'#.decode('utf-8') sd58 = ']]\n\n\n\n'#.decode('utf-8') rd58 = ']]'#.decode('utf-8') sd59 = ']]\n{{சொல்வளம்'#.decode('utf-8') rd59 = ']]~{{சொல்வளம்'#.decode('utf-8') sd60 = '([[பெயர்ச்சொல்|பெ ]])'#.decode('utf-8') rd60 = ''#.decode('utf-8') sd61 = '{{மொழிபெயர்ப்பு}}'#.decode('utf-8') rd61 = ''#.decode('utf-8') sd62 = "'''([[தமிழ்|தமி]])''' -"#.decode('utf-8') rd62 = ''#.decode('utf-8') sd63 = '== {{மொழி|en}} =='#.decode('utf-8') rd63 = ''#.decode('utf-8') sd64 = '=== பொருள் ==='#.decode('utf-8') rd64 = ''#.decode('utf-8') sd65 = '}}\n~#'#.decode('utf-8') rd65 = '}}~#'#.decode('utf-8') sd66 = '='#.decode('utf-8') rd66 = ''#.decode('utf-8') sd67 = 'பலுக்கல்'#.decode('utf-8') rd67 = ''#.decode('utf-8') sd68 = 'பெயர்ச்சொல்'#.decode('utf-8') rd68 = ''#.decode('utf-8') sd69 = '{{stub|ஆங்கிலம்}}'#.decode('utf-8') rd69 = ''#.decode('utf-8') sd70 = 'தொடர்புடையச் சொற்கள் '#.decode('utf-8') rd70 = ''#.decode('utf-8') sd71 = '\n\n[[விக்சனரி:அடிப்படை ஆங்கிலச் சொற்கள்]]'#.decode('utf-8') rd71 = '~[[விக்சனரி:அடிப்படை ஆங்கிலச் சொற்கள்]]'#.decode('utf-8') sd72 = '{{ஆதாரங்கள்-மொழி|en}}{{த.இ.க.க.}}'#.decode('utf-8') rd72 = ''#.decode('utf-8') sd73 = '{{ஆதாரங்கள்}}'#.decode('utf-8') rd73 = ''#.decode('utf-8') # wiktHeaderMeaning = modifiedContent1.replace(sd1,rd1).replace(sd2,rd2).replace(sd3,rd3).replace(sd4,rd4).replace(sd5,rd5).replace(sd6,rd6).replace(sd7,rd7).replace(sd8,rd8).replace(sd9,rd9).replace(sd10,rd10).replace(sd11,rd11).replace(sd12,rd12).replace(sd13,rd13).replace(sd14,rd14).replace(sd15,rd15).replace(sd16,rd16).replace(sd17,rd17).replace(sd18,rd18).replace(sd19,rd19).replace(sd20,rd20).replace(sd21,rd21).replace(sd22,rd22).replace(sd23,rd23).replace(sd24,rd24).replace(sd25,rd25).replace(sd26,rd26).replace(sd27,rd27).replace(sd28,rd28).replace(sd29,rd29).replace(sd30,rd30).replace(sd31,rd31).replace(sd32,rd32).replace(sd33,rd33).replace(sd34,rd34).replace(sd35,rd35).replace(sd36,rd36).replace(sd37,rd37).replace(sd38,rd38).replace(sd39,rd39).replace(sd40,rd40).replace(sd41,rd41).replace(sd42,rd42).replace(sd43,rd43).replace(sd44,rd44).replace(sd45,rd45).replace(sd46,rd46).replace(sd47,rd47).replace(sd48,rd48).replace(sd49,rd49).replace(sd50,rd50).replace(sd51,rd51).replace(sd52,rd52).replace(sd53,rd53).replace(sd54,rd54).replace(sd55,rd55).replace(sd56,rd56).replace(sd57,rd57).replace(sd58,rd58).replace(sd59,rd59).replace(sd60,rd60).replace(sd61,rd61).replace(sd62,rd62).replace(sd63,rd63).replace(sd64,rd64).replace(sd65,rd65).replace(sd66,rd66).replace(sd67,rd67).replace(sd68,rd68).replace(sd69,rd69).replace(sd70,rd70).replace(sd71,rd71).replace(sd72,rd72).replace(sd73,rd73) # removeTemplate = "\{.*\}"#.decode('utf-8') # onlyMeaning1 = re.sub(removeTemplate, '' , wiktHeaderMeaning) # print (onlyMeaning1) # removeCategories = "பகுப்பு*\:.*\]"#.decode('utf-8') # onlyMeaning2 = re.sub(removeCategories, '' , wiktHeaderMeaning) # onlyMeaning3 = onlyMeaning2.strip() # print (wiktHeader+'~~'+onlyMeaning3+'\n') # removeLine = "உச்சரிப்புதவி*\|.*\}"#.decode('utf-8') # onlyMeaning2 = re.sub(removeLine, '' , wiktHeaderMeaning) # onlyMeaning3 = onlyMeaning2.strip() # print (wiktHeader+'~'+onlyMeaning3+'\n') # with open('0-wiktHeaderWithMeaning.csv', 'a') as csvfile1: # writer = csvfile1.write(wiktHeader+'~~'+onlyMeaning3+'\n') # time.sleep(WAIT_TIME) # s45 = '=== பலுக்கல் ==='#.decode('utf-8') # r45 = ''#.decode('utf-8') # s46 = '===பலுக்கல்==='#.decode('utf-8') # r46 = ''#.decode('utf-8') #.replace('~~','~')