python

murata htmlã®æ–‡å—å¤‰æ›ï¼ˆK,M â†’æ•°å—ï¼‰

def main():


    import re
    import glob
    import os
    import shutil

    # åŒãƒ•ã‚©ãƒ«ãƒ€å†…ã®htmlãƒ•ã‚¡ã‚¤ãƒ«åã‚’å–å¾—
    file_name = glob.glob('*.html')[0]

    # å¯¾è±¡ãƒ•ã‚¡ã‚¤ãƒ«ã®çµ¶å¯¾ãƒ‘ã‚¹ã‚’å–å¾—
    path = os.path.join(os.getcwd(),file_name)

    # beforeãƒ•ã‚©ãƒ«ãƒ€ã®çµ¶å¯¾ãƒ‘ã‚¹ã‚’å–å¾—
    before = os.path.join(os.getcwd(),"before")
    # afterãƒ•ã‚©ãƒ«ãƒ€ã®çµ¶å¯¾ãƒ‘ã‚¹ã‚’å–å¾—
    after = os.path.join(os.getcwd(),"after")

    # ãƒ•ã‚©ãƒ«ãƒ€ã®æ–°è¦ä½œæˆï¼ˆæ—¢ã«ã‚ã‚‹å ´åˆã¯ä½œã‚‰ãªã„ï¼‰
    if not os.path.exists(before):
        os.makedirs(before)
    if not os.path.exists(after):
        os.makedirs(after)

    s = open('./'+file_name, 'r+',encoding="utf-16")

    data_lines = s.read()

    x=re.findall(r'[1-9]{1,4}.?[0-9]{0,8}[K,M]',data_lines)

    def km_change(text):
        if "K" in text:
            changed = format(float(text.replace("K","0"))*1000, '.2f')
        elif "M" in text:
            changed = format(float(text.replace("M","0"))*1000000, '.2f')
            
        return changed

    for i in x:
        data_lines=data_lines.replace(i,km_change(i))

    # afterãƒ•ã‚©ãƒ«ãƒ€ã¸ã®çµ¶å¯¾ãƒ‘ã‚¹ã‚’å–å¾—
    changed_file=os.path.join(after,file_name)

    # beforeãƒ•ã‚©ãƒ«ãƒ€ã¸ã®çµ¶å¯¾ãƒ‘ã‚¹ã‚’å–å¾—
    before_file=os.path.join(before,file_name)


    with open(changed_file, mode="w", encoding="utf-16") as f:
        f.write(data_lines)

    s.close()

    # å…ƒãƒ•ã‚¡ã‚¤ãƒ«ã‚’beforeãƒ•ã‚©ãƒ«ãƒ€ã¸ç§»å‹•
    shutil.move(path, before_file)
    

if __name__=='__main__':
    main()

Output

fdd

Was this helpful?

murata htmlã®æ–‡å­—å¤‰æ›ï¼ˆK,M â†’æ•°å­—ï¼‰

Output

murata htmlã®æ–‡å—å¤‰æ›ï¼ˆK,M â†’æ•°å—ï¼‰