添加URL
分享

C++中获取当前LUA堆栈信息

LuaPlus::LuaState* pState = ScriptManager::Instance().GetState();
if(pState)
    lua_getglobal(pState->GetCState(), "debug");
    lua_getfield(pState->GetCState(), -1, "traceback");
    int iError = lua_pcall(pState->GetCState(),
                            0,
                            1,
                            0);
    const char* sz = lua_tostring(pState->GetCState(), -1);
    MessageBox(NULL, sz, "", MB_OK);
		2018年6月27日 | 发布:Azure | 分类:开发之路 | 评论:0
	

关于data_format

data_format

这是一个无可奈何的问题,在如何表示一组彩色图片的问题上,Theano和TensorFlow发生了分歧,'th'模式,也即Theano模式会把100张RGB三通道的16×32(高为16宽为32)彩色图表示为下面这种形式(100,3,16,32),Caffe采取的也是这种方式。第0个维度是样本维,代表样本的数目,第1个维度是通道维,代表颜色通道数。后面两个就是高和宽了。这种theano风格的数据组织方法,称为“channels_first”,即通道维靠前。

2018年6月26日 | 发布:Azure | 分类:网络收藏 | 评论:0

Word2Vec尝试

ExportZhWiki.py

from gensim.corpora.wikicorpus import extract_pages,filter_wiki  
import bz2file  
import re  
from opencc import OpenCC
from tqdm import tqdm  
import codecs
import jieba  
CC = OpenCC('t2s')    
wiki = extract_pages(bz2file.open('zhwiki-20180620-pages-articles-multistream.xml.bz2'))  
def wiki_replace(d):  
    s = d[1]  
    s = re.sub(':*{\|[\s\S]*?\|}', '', s)  
    s = re.sub('<gallery>[\s\S]*?</gallery>', '', s)  
    s = re.sub('(.){{([^{}\n]*?\|[^{}\n]*?)}}', '\\1[[\\2]]', s)  
    s = filter_wiki(s)  
    s = re.sub('\* *\n|\'{2,}', '', s)  
    s = re.sub('\n+', '\n', s)  
    s = re.sub('\n[:;]|\n +', '\n', s)  
    s = re.sub('\n==', '\n\n==', s)
    s = re.sub('[ -~]','',s)
    s = re.sub(',', ',\n', s)
    s = re.sub('。', '。\n', s)
    #punctuation = """!?。"#$%&'()〈〉*+-/《:∶²;<·=>@[\]^_`{|〡}~⦅⦆「」、、〃》「」『』【】〔〕〖〗〘〙〚〛〜〝〞〟〰〾〿–—‘'‛“”„‟…‧﹏"""
    #re_punctuation = "[{}]+".format(punctuation)
    #s = re.sub(re_punctuation, "", s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\n\n', '\n', s)
    s = re.sub('\t', '', s)
    s = re.sub(' ', '', s)
    return CC.convert(s).strip()
i = 0  
f = codecs.open('jieba-zhwiki-articles.txt', 'w', encoding='utf-8')  
w = tqdm(wiki, desc=u'已获取0篇文章')
for d in w:
    i += 1  
    if not re.findall('^[a-zA-Z]+:', d[0]) and d[0] and not re.findall(u'^#', d[1]):  
        s = wiki_replace(d)
        if s!='':
            data=list(jieba.cut(s,cut_all=False))
            readline=' '.join(data)
            f.write(readline)
        if i % 100 == 0:  
            w.set_description(u'已获取%s篇文章'%i)
    else:
        if i % 100 == 0:
            w.set_description(u'当前文章%s被跳过'%i)
f.close()


2018年6月24日 | 发布:Azure | 分类:开发之路 | 评论:0

如何用Python做中文词云?

打算绘制中文词云图?那你得先学会如何做中文文本分词。跟着我们的教程,一步步用Python来动手实践吧。



2018年6月22日 | 发布:Azure | 分类:网络收藏 | 评论:0

在Unity中使用LayerMask

Layers通常被摄像机用来渲染部分场景,和灯光照射部分场景使用。但是它们也可以用来做射线检测时忽略一些collder或Collision使用。

2018年6月20日 | 发布:Azure | 分类:网络收藏 | 评论:0

selenium 安装与 chromedriver安装

直接使用pip安装

1 pip install selenium

用 Chrome 浏览器来测试

运行这段代码,会自动打开浏览器,然后访问百度。

2018年6月20日 | 发布:Azure | 分类:网络收藏 | 评论:0

使用 selenium 抓取电影数据,磁力链,迅雷下载地址

 使用 selenium 抓取某电影网站,电影数据,磁力链,迅雷下载地址, 并生成json文件保存。

website = 'https://www.piaohua.com/html/kehuan/2018/0509/33652.html'
FILM_TITLE = ''
FILM_PICTURE = ''
FILM_DESC = []
FILM_MAGNETS = []
FILM_TUNDERS = []
FILM_JSON = {}
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import json
mydriver = webdriver.Chrome('C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe')
mydriver.get(website)
mydriver.implicitly_wait(5)
title = mydriver.find_element_by_id("show")
title = title.find_element_by_css_selector("h3")
print(title.text)
FILM_TITLE = title.text
desc = mydriver.find_element_by_id("showinfo")
#链接图片
picture = desc.find_element_by_css_selector('img')
print(picture.get_attribute('src'))
FILM_PICTURE = picture.get_attribute('src')
#剧情介绍
desclist = desc.find_elements_by_css_selector("div")
desctext = ""
for d in desclist:
    print(d.text)
    FILM_DESC.append(d.text)
#下载地址(magnet)
magnet_link = mydriver.find_elements_by_css_selector('td[style="word-break: break-all; line-height: 18px"]')
for l in magnet_link:
    magnet_link1 = l.find_element_by_css_selector("a")
    linktext = magnet_link1.get_attribute('href')
    if linktext[0:6]=='magnet':
        print(linktext)
        FILM_MAGNETS.append(linktext)
#下载地址迅雷(thunder)
thunder_link = mydriver.find_elements_by_css_selector('a[onclick="return OnDownloadClick_Simple(this,2)"]')
for l in thunder_link:
    #ActionChains(mydriver).context_click(l).perform()
    mydriver.execute_script('ThunderNetwork_SetHref(arguments[0])', l)
    text = l.get_attribute('href')
    print(text)
    FILM_TUNDERS.append(text)
file = open(filename, 'w', encoding='utf-8')
jj = json.dump(FILM_JSON, file, ensure_ascii=False)
file.close()
mydriver.close()
mydriver.quit()


2018年6月19日 | 发布:Azure | 分类:开发之路 | 评论:0