爬蟲獲取19年4季度天天基金網(wǎng)基金持倉并進行可視化分析(上)

2022-09-04 12:27:09 9828

摘要：目的通過爬取基金持倉信息，我們可以了解基金的資金流向，說白了，就是知道大型基金公司都買了什么股票，買了多少。也可以跟蹤一些知名的基金，看看他們都買了什么股票，從而跟買或者不買，估值便宜的股票，又有很多基金入場，很可能這家公司大家都非?？春?，...

目的

通過爬取基金持倉信息，我們可以了解基金的資金流向，說白了，就是知道大型基金公司都買了什么股票，買了多少。也可以跟蹤一些知名的基金，看看他們都買了什么股票，從而跟買或者不買，估值便宜的股票，又有很多基金入場，很可能這家公司大家都非?？春?，未來業(yè)績很可能增長，可能是一次比較好的投資機會；而有些股票，估值已經(jīng)很高了，里邊還有很多的基金公司，這就需要注意了，很可能基本面發(fā)生一點點惡化，或者達不到預(yù)期，基金公司可能就會大幅的拋售，導(dǎo)致股價大跌。

本文分上、下兩個部分。

第一部分，講解如何爬取數(shù)據(jù)并存儲到mysql數(shù)據(jù)庫。

第二部分，對爬取出來的數(shù)據(jù)進行可視化分析。

1分析要爬取的網(wǎng)頁數(shù)據(jù)

需要獲取所有的基金代碼

http://fund.eastmoney.comllfund.html

with

獲取所有的基 class="hljs-keyword">open("test.html", "w", encoding="utf-8") as f: class="hljs-number">1) class="hljs-keyword">file = open("test.html", "r", encoding="utf-8") class="hljs-keyword">file, "lxml") class="hljs-string">"#bodydiv > div > div > div.basic-new > div.bs_jz > div.col-left > h4 > a")[0].get_text() class="hljs-string">"#bodydiv > div > div.r_cont > div.basic-new > div.bs_gl > p > label > span")[2].get_text().strip().split()[0] class="hljs-keyword">table = soup.select("#cctable > div > div > table") class="hljs-keyword">table[0].select("tbody > tr") class="hljs-keyword">for tr in trs: id="rttcu90" class="hljs-string">"td > a")[0].get_text() class="hljs-keyword">name = tr.select("td > a")[1].get_text() id="xzqqhvv" class="hljs-string">"td > span")[0].get_text() class="hljs-keyword">round(float(price), 2) class="hljs-keyword">except ValueError: class="hljs-number">0 class="hljs-keyword">num = tr.select("td.tor")[3].get_text() class="hljs-built_in">float(num.replace(",", "")) * float(price) class="hljs-keyword">data = { class="hljs-string">"crawl_date": today, class="hljs-string">"code": code, class="hljs-string">"fund": fund.split(" (")[0], class="hljs-string">"scale": scale, class="hljs-string">"name": name, class="hljs-string">"price": round(float(price), 2), class="hljs-string">"num": round(float(num.replace(",", "")), 2), class="hljs-string">"market_value": round(market, 2) class="hljs-keyword">data=pd.DataFrame([data]) class="hljs-keyword">data) class="hljs-keyword">except IndexError: class="hljs-string">"url": url 金代碼，循環(huán)調(diào)用get_info

def get_code(url):
    html = requests.get(url, headers=headers)
    html.encoding = "gbk"
    document = etree.HTML(html.text)
    info = document.xpath("// *[ @ id = "code_content"] / div / ul / li / div / a[1] /text()")
    i = 0
    for fund in info:
        str = fund.split("）")[0]
        code = str.split("（")[1]
        url = "http://fundf10.eastmoney.com/ccmx_%s.html" % code
        get_info(url)


if __name__ == "__main__":
    found_url = "http://fund.eastmoney.comllfund.html"
    get_code(found_url)

好了，4段簡單的代碼就可以講天天基金網(wǎng)里的數(shù)據(jù)都爬取到數(shù)據(jù)庫里了。

下次給大家講解如何用爬到的數(shù)據(jù)做可視化分析。

謝謝關(guān)注

本文地址：http://www.doubledring.cn/39050.html

版權(quán)聲明：本站所有文章皆是來自互聯(lián)網(wǎng),如內(nèi)容侵權(quán)可以聯(lián)系我們( 微信：bisheco )刪除！

色欲AⅤ亚洲情无码AV,成人在线三级片,欧洲偷拍视频网,五月天,色色色com,一级全黄色葡萄影视,一区 AV 保时捷在线

歐易(OKX)

火幣(HTX )

幣安(Binance)

爬蟲獲取19年4季度天天基金網(wǎng)基金持倉并進行可視化分析(上)

相關(guān)推薦

天天基金網(wǎng)去年銷售基金逾5200億元

上半年天天基金網(wǎng)基金銷售額同比增2

關(guān)于旗下部分基金參加天天基金網(wǎng)費率優(yōu)惠的公告

排行榜買基金,讓我輸?shù)舻籽?天天基金網(wǎng)5個參數(shù)不能不看

爬蟲獲取19年4季度天天基金網(wǎng)基金持倉并進行可視化分析(上)

中?；鸸芾碛邢薰娟P(guān)于旗下部分基金在上海天天基金銷售有限公

天天基金上半年靠賣基金凈利潤過億

天天基金“基金單周申贖比”新功能消失不見

2022Q2基金銷售渠道數(shù)據(jù)點評:天天基金增速領(lǐng)先

天天基金上半年基金銷售額近萬億

天天基金銷售額首次突破2萬億!首批基金公司去年經(jīng)營情況陸續(xù)曝

三季度基金代銷江湖再生變,天天基金非貨保有規(guī)模超工商銀行

關(guān)于旗下部分基金參加天天基金費率優(yōu)惠活動的公告

關(guān)于旗下基金參與上海天天基金銷售有限公司費用優(yōu)惠活動的公告

基金用支付寶還是天天基金?